TOEICに出現する単語数は10,973語

TOEIC試験の学習中、すべての受験者がぶつかる壁が単語力である。

あなたはTOEICの英単語について、次のような疑問を持っていないだろうか?

  • TOEICを解くにはどのくらいの単語力が必要?
  • TOEICに出る語句と出ない語句の違いは?
  • スコアアップにはどの語句を覚えるべき?

市販の単語帳は優れたものが多いが、その内容はTOEICによく出るとされる英単語の羅列である。私たちがどうやって単語対策に取り組めばいいか、その全体像を示すものは少ない。

そこでトイグルでは、TOEICスコアアップに必要な単語力について詳細を解説していきたい。

この記事を読めば、TOEICで成果を上げるのに必要な単語学習のやり方が分かる。そして、今日からでも新しい方法で学習に取り組めるようになるだろう。

(この記事を書くにあたって、現在販売されている5冊の公式問題集をデータ入力して、試験に必要な単語数、およびその優先順位を算出しました。すべて筆者の手作業で行っているため、数値が完全に正確な保証はありません。参考程度にお考えください。)

*目次

1. TOEICに出現する単語数

TOEICはリスニングセクションとリーディングセクションの2科目から成る試験である。それぞれ100問ずつ、合計200問の設問に解答する。制限時間は約120分で、すべてマークシートに解答を記入する。

結論的に言えば、TOEICに出現する単語数は次のようになる。

  1. TOEICは1回の試験で約10,973語を読んだり聞いたりする
  2. 重複語彙を除けば、1回の試験で約2,585語を理解する
  3. 動詞や名詞の変化形を除くと、1回の試験で約2,100語の知識が必要

詳細を見ていこう。

1-1. TOEICは1回の試験で約10,973語を読んだり聞いたりする

TOEICは1回の試験で約10,973語を読んだり聞いたりする。これは、私たちがTOEICを解く際に「処理」する語句の合計と言っても良い。

例を見てみよう。

I am writing to inquire whether you might be available to make an appearance at The Shaughenessy Bistro in January or February.

(1月か2月にあなたがThe Shaughenessyビストロに登場する都合をつけていだだけるかを尋ねるために書いています。)

(公式 TOEIC Listening&Reading 問題集3 p106)

この文に出現する単語を1つずつ数えれば、合計22語となる。この数え方において、TOEICはリスニング・リーディングの全パートで約10,973語が出現する。

内訳は次のとおり。

  • リスニングセクション: 約4,893語
  • リーディングセクション: 約6,080語
  • 試験全体: 約10,973語

リスニングセクションは約4,893語、リーディングセクションは約6,080語、合計が約10,973語となる。

約120分間の試験で1万語以上を処理するのだから、TOEICで成果を出すポイントの一つは英単語を素早く処理できる力であろう。日頃から大量の英文に触れることが望まれる。

1-2. TOEICを解くには約2,585語を理解できる必要がある

英語は特定の語句が繰り返し使われることが多い。例えば、company(会社)はTOEIC頻出語句だが、これが文中に2回出てきた時、それを「2語知っている」と数えるのは不自然だろう。

そこで、TOEICに出現する語彙から重複を除くと、試験全体を解くのに理解する語句は約2,585語となる。

先程の例文をもう一度見てみよう。

I am writing to inquire whether you might be available to make an appearance at The Shaughenessy Bistro in January or February.

(1月か2月にあなたがThe Shaughenessyビストロに登場する都合をつけていだだけるかを尋ねるために書いています。)

(公式 TOEIC Listening&Reading 問題集3 p106)

この文では、toという語が2回出現している。これらを1語と数えれば、この文は21語で構成されていることがわかる。

この方法でTOEICの内訳を表すと、次のようになる。

  • リスニングセクション: 約1,302語
  • リーディングセクション: 約1,913語
  • 試験全体: 約2,585語

試験では約10,973語を処理するが、その多くは2回・3回と重複して出現するため、設問解答に使う語彙は約2,585語の計算となる。

(筆者注: この数え方において、リスニングとリーディングの合計は「試験全体」と合致しない。これは、例えば、we(私たち)という語句がリスニングとリーディングに出ればそれぞれ「1」とカウントされて「2」になるが、試験全体では「1」となるからである。)

1-3. TOEICは変化形を除くと約2,100語の知識が要求される

英語では、語句に何らかの文法的な操作が加わることで、語の形が変化することがある。

例えば、動詞workは三単現のsがつくとworks、現在分詞形ではworking、過去形および過去分詞形ではworkedとなる。これらを「4語知っている」と数えるのは奇妙で、実際は「workという1語とその変化形を知っている」と考えるのが自然だろう。

そこで、TOEIC出現語彙から重複を除き、さらに上記のような変化形を1語と数えれば、試験を解くのに必要な語彙数は実質的に約2,100語となる。

先程の例文をもう一度見てみよう。

I am writing to inquire whether you might be available to make an appearance at The Shaughenessy Bistro in January or February.

(1月か2月にあなたがThe Shaughenessyビストロに登場する都合をつけていだだけるかを尋ねるために書いています。)

(公式 TOEIC Listening&Reading 問題集3 p106)

この文では、amとbeはどちらも「be」として1語にカウントできる。toの重複もあるため、この文に必要な語彙数は20語と算出される。

この方法でTOEICの内訳を表すと、次のようになる。

  • リスニングセクション: 約1,104語
  • リーディングセクション: 約1,604語
  • 試験全体: 約2,100語

語句の変化は動詞に多いが(三単現のs、過去形、現在分詞形、過去分詞形など)、名詞の変化(単数形と複数形など)や、形容詞の変化(比較級など)もあった。

TOEIC出現単語数を今一度まとめよう。

  • TOEICは1回の試験で約10,973語を読んだり聞いたりする。そのうち、多くの語彙は2回、3回と複数使われるから、重複を除けば試験には約2,585語が出現する。さらに、語句の変化形を1語と数えれば、試験を解くのに実質的に必要な語彙数は約2,100語となる。
TOEIC頻出単語500語

TOEICスコアアップに必要な頻出語彙は、こちらのページで別途紹介しています。

2. TOEIC対策で身につけるべき単語数

TOEICを解くのに約2,100語の知識が必要であることがわかった。

それでは、私たちは2,100語の英単語さえ暗記すれば、TOEICの出題語句をすべて網羅できるのだろうか? TOEICは2,100語の知識しか問われない簡単な試験なのだろうか?

この答えは「No」である。理由は単純で、TOEICはいつも決まった2,100語から出題されるわけではないからだ。

筆者の計算では、TOEICに出る可能性のある語句は10,000語近くある。そのうち、毎回必ず出題される「高頻出語彙」、絶対に出るとは限らないが見かけることの多い「中頻出語彙」、そして滅多に出題はされないが解答の判断に影響を与える「低頻出語彙」があり、試験によって出てくる語彙の組み合わせは異なる。

つまり、TOEICの設問数は毎回200問と固定されているから、出現する単語数が結果的に2,100語前後なだけであり、満足して試験に解答するためにはその何倍もの語彙力が必要なのである。

TOEIC単語数の分布を見ながら、この問題について詳細を分析していこう。

2-1. TOEICを解くには最低でも3,000語を習得する

次の表は、TOEICに出題される語彙のランキングと、その出現回数が試験に占める割合を示している。

割合 割合(累積)
1位〜10位 24.022% 24.022%
11位〜100位 27.431% 51.453%
101位〜1,000位 32.899% 84.353%
1,001位〜3,000位 10.742% 95.095%
3,001位〜6,000位 3.976% 99.071%
6,001位〜 0.929% 100.000%

TOEICにもっともよく出現する語は1位のtheで、出現頻度は5.083%となった。2位はbe(4.366%)、3位はa(3.359%)、4位はto(3.246%)、5位はof(1.650%)と続き、上位10語だけで全出現語彙の24%を占める。

1位から100位までの上位100語は出現語彙の51.453%を占める。上位1,000語は84.353%、上位3,000語は95.095%となる。

単語学習の研究によれば、人は最低でも文中の95%の単語を知らないと、その文を正しく理解できないという。この意味において、TOEICを満足に解けるようになるには、最低でも3,000語(カバー率95.095%)を習得している必要がある。

筆者注: ここで言う3,000語は『1-3. TOEICは屈折などの変化を除くと約2,100語の知識が要求される』の数え方による。変化形も含めればさらに多い語彙の知識が要求される。

2-2. 高難易度の語句ほど出現可能性が低い

テキスト内の約95%が頻出語彙3,000語で占められていることがわかった。問題は「残りの5%」を知るのに、追加で3,000語以上の単語が必要とされることである。

次の図は、先程の出現回数のデータをグラフで表したものである。

TOEIC単語の出現頻度

上位3,000語まではグラフの伸びに勢いがあるが、それ以降は語彙数が増えてもわずかにしか出現が増えない。要するに高難易度の英単語ほど低頻出であり、レベルが上がるほど学んだ語彙が出づらくなるのである。

TOEIC初心者は「知らない単語だらけで試験が解けない」が、TOEIC上級者は「たまに出てくる高難易度の語句がわからずスコアを上げられない」に直面する。

どれだけレベルが上っても単語に関する課題は残り続けるから、単語を覚えられないことをストレスに感じるよりも、文脈から推測する力を養うなど、知らない語句への対象法を身につけることが望まれる。

2-3. TOEICに毎回出るのは頻出語彙の約6割

次の図は、TOEICによく出る上位3,000語を出現頻度の分布で表したものである。

TOEIC単語の分布

出現頻度の高い語句が占める割合が多い一方、出現頻度の低い語句がなだらかに伸びる「ロングテール」の構造になっている。

筆者の調べたところによると、TOEICで毎回1度以上出現する語彙は、出現頻度の上位1,262語だった。

これまで議論してきたように、TOEIC1回を解くのに理解すべき語彙は約2,100語である。つまり、TOEICに出現する語彙の約4割(約838語)は、ロングテール部分、すなわち「出題される可能性はあるが、実際に使われるかはわからない」語句となる。

TOEIC単語の分布

では、TOEICを解くのに必要な語彙数はどのくらいだろうか? 具体的な数を特定するのは難しいが、筆者の肌感覚では、10,000語に近い語彙力が必要と考える。これは変化形も合わせて1語とカウントする方法だから、実際に認識する単語数はそれよりも多い。

したがって、冒頭で問題提起したように、TOEICを解くには2,100語分の知識が必要だが、満足して試験に解答するためにはその何倍もの語彙が必要と結論づけられる。

(筆者注: グラフの表記に関して、出現頻度1位のtheは1試験辺り5.083%、2位のbeは4.366%、10位のwillは1.161%と縦軸の値(0.5%)よりも大きい。ただ、グラフが見にくくなってしまうため、あえて縦軸の最大値を0.5%として表記した。)

参考: TOEICに出る語句は「特殊」なのか?

「TOEICは日常生活で使わない特殊な語句が多い」と言われることがあるが、これは本当だろうか?

次の図は、英語圏で使われる様々なジャンルのテキストとTOEICを、98%の語彙をカバーするのに必要な単語数で比較したものになる。

ジャンル 98%のカバー率
小説 9,000
ワードファミリー
新聞 8,000
ワードファミリー
話し言葉 7,000
ワードファミリー
子供向けの映画 6,000
ワードファミリー
TOEIC® Listening and Reading Test 4,864 レマ

(出所: Learning Vocabulary in Another Language p16を筆者が修正して作成)

「ワードファミリー」は派生語も合わせて「1語」と数える方法である。例えば、sufficientsufficientlyは合わせて1語と換算する。

TOEICは変化形を含めて1語とする方法(これを「レマ」と呼ぶ)でカウントしているから、単純な比較はできないが、TOEICは英語圏で実際に使われるテキストに比べて、遥かに小さな語彙数で作られているのがわかる。

つまり、TOEICに出る語句は特殊というよりむしろ、試験向けに「制限」されているのである。実際、TOEICにはスラング(俗語)、専門用語、その他試験として不適切な語彙は出てこない。

それでは、TOEICはなぜ「特殊な語句が多い」と誤解されるのだろうか? 筆者は、その理由を「日常生活 = 友達同士のおしゃべり」と限定することで生まれているのではないかと考える。

たしかに、日常生活では、友達や家族の間でカジュアルな会話をする機会は多い。しかし、私たちは接客サービスを受ける際にフォーマルな言葉を聞いたり、仕事できちんとした文体のEメールを読んだり、かしこまった文体の記事を読むことを日常的に行っている。

要するに、日常生活とはカジュアルな会話だけで成り立つものではないのだ。この意味で、TOEICに出題される語句は相当に「日常的」である。英語を外国語として学ぶ私たちにとって、TOEICは英語力の基礎を作るのに適した題材を提供している。

3. TOEIC単語数の分析を学習に活かす3つのポイント

TOEIC単語数の分析を英語学習に活かす3つの点を提案したい。

3-1. 最低でも1冊の単語帳を終える

現在、市販の単語帳は複数のものが販売されているが、代表的なタイトルを見出し語順に並べると次のようになる。

タイトル 見出し語数
キクタン TOEIC TEST SCORE 600 1,120語
キクタン TOEIC TEST SCORE 800 1,120語
TOEICテスト スーパー英単語 1,005語
TOEIC L&R TEST 出る単特急 金のフレーズ 1,000語
世界一わかりやすい TOEICテストの英単語 804語

派生語などの関連語句を収録していれば、見出し語よりも学べる語彙数が多い場合もあるが、1冊の単語帳は概ね1,000語前後が収録されていることがわかる。

目標とするTOEICスコアによって学習方法は変わるが、試験を満足に解けるようになるには3,000語が必要なことから、単語帳は最低でも1冊は必ず終えなければならない。

おすすめ単語帳は別記事で紹介している。

3-2. 新規語彙だけでなく語彙の流暢さを伸ばす

単語学習というと新規語彙の暗記ばかりを想像しがちだが、TOEICで成果を出すには語彙の流暢さも必要である。

語彙の流暢さとは、特別な注意を払わずに単語を認識できる力を指す。例えば、important(重要な)という語句を読んだ時、意味を即座に理解できなければ、10,000語以上を処理するTOEICで成果を出すのは難しい。

語彙の流暢さを伸ばす一つの方法として、問題集のやり込みがある。既に解いた設問、あるいは今の自分のレベルより一段階やさしい英文を使うことで、語彙を高速で処理する力を養おう。

おすすめの問題集は別記事で詳しく紹介している。

3-3. 単語は幅だけでなく深さも大切

単語力には「幅」と「深さ」がある。

単語力の「幅」とは、知っている単語の数を指す。本記事でこれまで分析してきたような語彙の知識は、単語の幅のことを指す。

単語力の「深さ」とは、特定の単語に関する用法の知識を指す。例えば、boardという語句は名詞では「板」と「取締役会」の意味があり、動詞では「乗車する」の意味がある。

TOEICでは単語の幅だけでなく深さも必要だ。特に、基本的な語彙ほど多義的な場合が多いので、たくさんの英文に触れる経験が望まれる。

単語の深さを改善する勉強法の一つに多読がある。多読に関しては別記事で解説しているため、ぜひともご覧いただきたい。

参考: TOEIC Part7の単語数

TOEIC Part7(長文読解問題)の出現語彙数を設問数で割れば、1問を解くのに必要な単語数がわかる。

設問 1問を解くのに
必要な語彙数
シングルパッセージ 84語
ダブルパッセージ 87語
トリプルパッセージ 106語
Part7の平均 90語

シングルパッセージ問題は、1問あたり平均して84語を読んで答える。ダブルパッセージは87語、トリプルパッセージは106語、TOEIC Part7の平均は90語である。

シングル・ダブル・トリプルと問題が進むに連れて、設問を1つ解くのに必要な語彙数が増える。これは、古くから言われる「TOEICリーディングセクションは後半になるに連れて難易度が上がる」の経験則とも矛盾しない。

もちろん、語彙数だけが難易度を決めるわけではないため、TOEIC Part7を攻略するにはこれ以外の要素も必要だ。ただ、Part7に取り組むにあたって一つの参考にはなるだろう。

*まとめ: 単語を制したものがTOEICを制する

この記事ではTOEICの出現単語数について、詳細を解説してきた。

要点をまとめると次のようになる。

  1. TOEICは1回の試験で約10,973語を読んだり聞いたりする
  2. 重複語彙を除けば約2,585語の知識が問われる
  3. 変化形を除くと約2,100語の知識が問われる
  4. 毎回同じ語句が試験に出るとは限らない
  5. よって、試験を解くには最低でも3,000語を覚える

TOEICスコアを上げるには総合的な英語力が必要とされる。リスニング力、リーディング力、文法力、試験の理解、本番慣れ、その他たくさんの力の達成度が成果を決める。

ただ、TOEICスコアに決定的な影響を与えるものを一つ上げるとすれば、それは単語力だろう。TOEICスコアを上げるなら、単語を徹底的にやり込もう。

Good luck!

付録1: TOEIC単語数データの収集方法
TOEICは問題用紙の持ち帰りが禁止されているため、過去問題集(過去問)が存在しない。そのため、本記事のデータは『公式 TOEIC Listening and Reading 問題集』、いわゆる「公式問題集」を分析することで収集した。

公式問題集を採用した根拠は次の3つである。

  1. TOEIC試験を制作するETSが作成しているため、品質に十分な信頼性がある。
  2. リスニング・リーディング共に本番と同じ形式で作られているため、試験の傾向を知るのに適切である。
  3. 2018年12月現在、新形式対応の公式問題集は5冊(合計2,000問分)が販売されており、単語の出題傾向を知るのには十分な量である。

本記事で使用した公式問題集は次のとおり。

TOEICテスト公式問題集 新形式問題対応編 公式0
公式 TOEIC Listening & Reading 問題集 1 公式1
公式TOEIC Listening & Reading 問題集2 公式2
公式 TOEIC Listening & Reading 問題集 3 公式3
公式 TOEIC Listening & Reading 問題集 4 公式4

(タイトルが『TOEICテスト公式問題集 新形式問題対応編』から『公式 TOEIC Listening and Reading 問題集X』へと変わった理由は、TOEICプログラムの刷新により、試験の名称がTOEIC Listening and Reading Testへと変わったためと考えられる。)

付録2: 英単語の数え方
英単語の数え方は複雑なため、目的に合わせて次の4つの中から最適なものを使用した。

  • Token(トークン, 延べ語数): テキストに現れる語数をそのまま数えたもの
  • Type(タイプ, 異なり語数): 延べ語数から重複を除いたもの
  • Lemma(レマ): 見出し語とその屈折形(三単現のs, 分詞, 比較級など)を合わせたもの
  • Word Family(ワードファミリー): 見出し語に屈折形や派生語を合わせたもの

トークンは『1-1. TOEICは1回の試験で約10,973語を読んだり聞いたりする』、タイプは『1-2. TOEICを解くには約2,585語を知っている必要がある』、レマは『1-3. TOEICは屈折などの変化を除くと約2,100語の知識が要求される』にそれぞれ対応する。

付録3: TOEIC公式問題集の出現語彙数一覧
 TOEIC公式問題集の出現語彙数一覧は次のとおり。

Token Type Lemma
公式0 Test1 Listening 4,976 1,334 1,112
Reading 6,309 1,976 1,680
試験全体 11,285 2,659 2,182
Test2 Listening 4,907 1,297 1,096
Reading 6,439 1,967 1,554
試験全体 11,346 2,609 2,034
公式1 Test1 Listening 4,883 1,305 1,113
Reading 5,740 1,782 1,519
試験全体 10,623 2,486 2,041
Test2 Listening 4,773 1,199 1,015
Reading 5,708 1,845 1,542
試験全体 10,481 2,432 1,965
公式2 Test1 Listening 4,799 1,326 1,125
Reading 6,059 1,953 1,660
試験全体 10,858 2,647 2,155
Test2 Listening 4,947 1,321 1,134
Reading 6,210 1,966 1,656
試験全体 11,157 2,646 2,174
公式3 Test1 Listening 5,001 1,367 1,145
Reading 6,118 1,874 1,538
試験全体 11,119 2,590 2,062
Test2 Listening 4,985 1,320 1,124
Reading 6,262 1,982 1,632
試験全体 11,247 2,663 2,138
公式4 Test1 Listening 4,873 1,271 1,084
Reading 5,865 1,857 1,596
試験全体 10,738 2,529 2,106
Test2 Listening 4,783 1,278 1,092
Reading 6,092 1,926 1,659
試験全体 10,875 2,589 2,138
  • 注1: リスニングとリーディングの合計が「試験全体」と合致しないのは、TypeおよびLemmmaでは語彙の重複があるからである。例えば、we(私たち)という語句がリスニングとリーディングに出ればそれぞれ「1」とカウントされて「2」になるが、試験全体では「1」となる。
  • 注2: 対象語彙はリスニング・リーディングの本文だけでなく、設問文も含んでいる。これは、受験者が問題を解く際、本文だけでなく設問も読み聞きをして解答するからである。
  • 注3: リスニングセクションのサンプル問題、および各パートのDirectionsは設問解答に影響を与えないため、対象外とした。
付録4: TOEIC各パートの出現語彙数
TOEIC各パートの平均出現語彙数は次のとおり。

Token Type Lemma
Part1 163 89 84
Part2 607 306 285
Part3 2,367 760 671
Part4 1,756 669 593
Part5 574 406 376
Part6 623 356 325
Part7 4,883 1,953 1,695

(「TOEIC」は米国Educational Testing Service(ETS)の登録商標です。)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です