そのリストほんとにイミあるのー?という方へ
これらの単語はこういう研究の結果だから意味があるんだよ!
とお伝えするための投稿
ぶっちゃけ知らなくてもいいんじゃないかと思う(笑)
最も効率的な英単語リスト
本投稿は、NEW GENERAL SERVICE LISTによる研究結果を翻訳し、
完全無料で使える英単語帳にしたものです。
通常会話の90%をカバーする700語
一般的な生活のための2100語
TOEICやビジネス
これらのための単語リストです。
ネイティブスピーカーの平均的な語彙を次のグラフのようにカバーできます。
たとえばTOEICであれば最大99%をカバーできるようになります。
New General Service Listって何?
「英語を第二言語とする学生」のために、頻度の高い単語のリストを作る!
そう思われた博士がおられます。
チャールズ・ブラウン博士
ブレント・カリガン博士
ジョセフ・フィリップス博士
の3名です。
元となるのはGeneral Service List(GSL、後述)です。
テキストや発話を大規模に集めてデータベース化した言語資料のことを
「コーパス(Corpus)」
と呼ぶのですけれど。
「Cambridge-English-Corpus(CEC、後述)」の2.7億語の92.34%を、
約2800の単語でカバーするリストを作られました。
<コーパスのサブセクション>
より詳細はWikpediaにて
General Service List(GSL)って何?
1953年にMichael Westが公開した重要な語彙リストで、
口語のスピーチの約90〜95%と一般的な文章の80〜85%を理解するためのものです。
GSLは、
・20年以上にわたって行われたコンピューター前のコーパス研究
・ハロルドパーマーなどの20世紀初頭の有名な研究者の助力
・30年代にカーネギー財団がスポンサーとなったいくつかの語彙会議
を経て作られました。
単なるリストではありません。
客観的基準・主観的基準を組み合わせて
英語を第二言語とする人にとって
「普遍的なサービス」になる
という単語のリストです。
このリストは何十年に渡って有効だったのですが、時代の流れにより
・コーパス自体が古いのでは?
・近代的な基準では小さすぎるのでは?(250万ワードのコーパスに基づいていました)
と指摘が入るようになり、博士らがNGSLとして改訂するに至りました。
より詳細にご興味のある方は Wiki General Service List をご参照ください。
ケンブリッジ イングリッシュ コーパスって何?
「Cambridge-English-Corpus」
「ケンブリッジ英語コーパス」
CECと略されます。
世界最大のコーパス(言語データベース)で、新聞、インターネット、書籍、雑誌、ラジオ、学校、大学、職場や日常会話等から集められ、常に更新されています。
CECは、分野別等の複数の小さなコーパスで構成されています。
現在は173か国の220,000人以上の学生が提出したケンブリッジ試験のスクリプトから取得した5,000万語を超えるケンブリッジ学習コーパス(CLC)が含まれます。例えばCLCを使用すると、「英語の学習者と専門家の話し方の違い」を分析できます。
要は「日本に限らず、世界で最も膨大なデータベースなんだな」と思ってください。
※専門家から見ればご指摘もあるかと思います。
より詳しい情報をお求めの方は次のリンクよりどうぞ。公式です。
本当に効果的なの?
それぞれのワードは、バックテスト抽出されていますから、実際に使ったらどうなのか、というフォワードテストが必要です。
と思っていた矢先にえいらく様にて検証しておられました。
カバー率計測結果
対象 | NGSL | NGSL | NGSL +TSL +NAWL +BSL | |||
---|---|---|---|---|---|---|
+TSL | +NAWL | +BSL | ||||
英単語リストの掲載語数 | 2801 | +1259 | +963 | +1754 | 5619 | |
小説 | ① ハリーポッター | 86.7% | 87.8% | 87.3% | 87.6% | 88.6% |
マンガ | ② よつばと! | 88.9% | 90.6% | 89.4% | 89.6% | 91.2% |
ドラマ | ③ フラーハウス | 88.4% | 89.7% | 89.0% | 89.2% | 90.0% |
英語試験 | ④ TOEIC | 89.5% | 93.9% | 91.0% | 92.5% | 94.2% |
⑤ 英検準1級 | 88.8% | 91.2% | 90.2% | 90.7% | 92.4% | |
学術向け | ⑥ TED講演 | 89.6% | 90.8% | 91.4% | 91.4% | 92.6% |
ニュース | ⑦ NHKニュース | 86.2% | 88.5% | 88.1% | 89.1% | 90.3% |
⑧ CNN ニュース | 86.7% | 88.3% | 87.8% | 90.0% | 90.6% |
NGSL、TSL、NAWL、BSLそれぞれの英単語リストで英文カバー率を計測した結果は上記の通りです。
なお、TSL、NAWL、BSLはNGSLと組み合わせて利用する英単語リストなので、
それぞれNGSLと組み合わせた時のカバー率
NGSL+TSL+NAWL+BSLの4つの英単語リストすべて合わせた時のカバー率
も掲載しています。
また、参考としてGSL、GSL+AWLでのカバー率も掲載しています。
結果、公式サイトで言われているほどではありませんでしたが
NGSLはどの分野でも高いカバー率があり
かつTSL、NAWL、BSLはそれぞれの分野で頻出する英単語が掲載されているのは
間違いなさそうです。
公式の英文カバー率の計測方法は、his、herなどの代名詞は見出し語のheやsheなどでカウントしているのではないかと思います。
本記事ではhis、herなどはその単語のまま扱っている分カバー率が低く出ているとお考えください。
えいらく NGSL、NAWL、TSL、BSL全部覚えたら語彙レベルはいかほどか?
9割近く分かればあとは文脈判断で対応できます。
英語学習のロードマップと単語帳
博士たちの研究成果は、次のリストからできています。
まずはNGSL-Sを学びましょう。
次にNGSLを学びます。
その次は、あなたが何をしたいかにより変わります。
学生であればNAWL、ビジネスマンならBSL、TOEICを受けるのならTSLを学びましょう。
NAWL、BSL、TSLには重複する単語があります。例えばauthorityやconference等です。
こちらのシステムでは、NGSLと、NAWL/BSL/TSLには単語は重複しないはずですが、
NGSL+NAWL、NGSL+TSL等と想定されているため、NAWL/BSL/TSLに共通で頻出の単語は、それぞれのリストに含まれることになります。
2017年にTOEFLのリストが追加されました。
納得いただけたでしょうか?
頂けてたらいいなぁ
まぁ見てみようか、という方は英単語まとめよりどうぞ