【2020/01/21】2020年のセンター試験データを追加しました。
センター試験の長文の難易度って、一体どれぐらいなのか、気になったことありませんか?
例えば、センター試験の長文がアメリカの学年で言えば何年生ぐらいのレベルなのか、それを数値で表して長文参考書などと比較ことが出来たら、参考書選びにも役に立ちそうですね。
そこで今回は、まずセンター試験の長文の難易度を数値で検証してみます。
※結果だけ知りたい方は目次からどうぞ。
使用する指標(FKGと難単語率)について
このサイトでは、英文の難易度をFKG(Flesch-Kincaid Grade level)という数値と、難単語率を使って表現します。
※「FKG」とは、英語圏で既に正式に使用されている指標で、簡単にいうと「文章全体で、1文1文が長いほど難しく、使っている単語も長い(音節が多い)ほど難しい、というのを数値化して、アメリカの何年生レベルになるかを数式で調整した値」です。
※「難単語率」とは、FKGの弱点である、単語の難易度が無視されてしまう、という点をカバーして単語の難易度も数値に反映させるため「文章全体で基本単語3000語に含まれない単語の比率」とこのサイト独自に定義したものです。
なお、このサイトでは、基本単語にOXFORD3000というリストを使用します。
※このサイトでは、総合的な難易度を比較できるように、「FKG」に「難単語率の数字÷5」(5%なら1)を足したものを総合難易度として定義します。
長文難度比較シリーズをまとめたページはこちら↓
なお、FKGと難単語率についての更に細かい検証と説明については、以下の記事をご覧ください。
検証に使用した年度
センター試験の長文は、新しくなるにつれて徐々に語数が増えているので、最近のデータを活用したほうが良いと考え、2017、2018、2019の3年度分を使用しました。直近3年分は、大学入試センターのサイトで公開されています。
(なお、2018年度分は、なぜかテキストデータをコピーできる形式のPDFファイルだったのですが、2017と2019はスキャンデータだったのでOCRを使用してテキスト化しました。統一してテキストデータにしてほしいです。。)
検証対象とした大問
センター試験では、主に問3~6が読解系の問題なのですが、FKGの算出に向いているオーソドックスな評論や記事的な内容の問6を対象としました。主な理由は以下の通りです。
・問3は、1つの文章が短いものがあり、FKGの数値に偏りが出やすい。また、会話的な内容では、「Yes.」や「I think so.」などが極端に短くなり、極端に簡単な数値になる。
・問4のチラシやウェブサイトなどは、文にならない部分も多いため算出不可。
・問5は使えなくはないが、やはり物語の時などにセリフ的な文があると極端に数値が低くなる。
検証結果!
2020年度 問6
FKG 9.8(アメリカの9年生=中3レベル)
難単語率 6%(94%は3000語レベル内)
参考書ウォーズ総合難度 11
2019年度 問6
FKG 9.6(アメリカの9年生=中3レベル)
難単語率 3%(97%は3000語レベル内)
参考書ウォーズ総合難度 10.2
2018年度 問6
FKG 9.8(アメリカの9年生=中3レベル)
難単語率 6%(94%は3000語レベル内)
参考書ウォーズ総合難度 11
2017年度 問6
FKG 8.2(アメリカの8年生=中2レベル)
難単語率 2%(98%は3000語レベル内)
参考書ウォーズ総合難度 8.6
平均値
FKG 9.4(アメリカの9年生=中3レベル)
難単語率 4.3%(95.7%は3000語レベル内)
参考書ウォーズ総合難度 10.2
いかがでしょうか?さすがセンター試験、かなり難易度を調整しているような感じがしますね。
使用単語も、基本的な単語だけで読解できるように工夫されているように思います。
最終年である2020年も、きっちり難度を調整しているような印象がありますね。
センター試験の後継となる「共通テスト」のプレテスト(試行調査)についても同様の検証をしてみましたので、是非ご覧ください↓