「男性のほうがIQが高い」は本当でしょうか。
4万6000人以上のデータを分析した研究では、男女の平均IQの差はほぼ無視できるレベルという結果が出ています。
この記事では、IQ平均の男女差について、大規模データをもとにわかりやすく解説します。
「男子は理系、女子は文系」という言葉を、一度は耳にしたことがあるのではないでしょうか。
テストの点数や成績を見て、「やっぱり男女で得意なことが違う」と感じた経験がある人も多いはずです。
IQの男女差については、長年にわたってさまざまな議論が続いてきました。
従来は、「全体的な知能(IQ)において男性がわずかに高い」と考えられてきた時期もありました。
しかし近年の大規模な研究では、その通説が大きく揺らいでいます。
論文のタイトルは「知能における性差の行き詰まり:WISCバッテリーを用いたメタ分析」で、学術誌『教育心理学レビュー』に2022年に掲載されました。
79件の研究・4万6000人以上のデータを統合した、この分野では最大規模の分析のひとつです。
今回も、性格研究者で悪者図鑑著者のトキワ(@etokiwa999)が解説していきます。
※HEXACO-JP性格診断を開発しました!MBTIより科学的根拠があります。詳細は以下タップしてください。

研究の内容と規模
4万6000人分のデータを統合した分析
この研究は、79件の論文をまとめて分析した大規模なものです。
このような手法を「メタ分析」と呼びます。
メタ分析とは、複数の研究を統合してより確かな結論を導く方法です。
参加者の合計は4万6605人にのぼります。
内訳は男性2万3404人・女性2万3201人です。
分析に使われたデータの規模は以下のとおりです。
- 研究数:79件(1961〜2019年発表)
- 参加者総数:4万6605人
- 独立した標本数:134
- 効果量(差の大きさを示す値):640個
つまり、1つの研究では見えにくい「本当の差」を、膨大なデータで明らかにしようとしました。
データ数が多いほど、結果の信頼性は高まります。
この研究の規模は、IQの男女差を扱った研究の中でも特に大きな部類です。
子ども向けテスト「WISC」に絞った理由
この研究は、「WISC(ウィスク)」という知能テストだけを対象にしています。
異なるテストを混在させると、結果の比較が難しくなります。
そこでこの研究では、世界で最も広く使われる子ども向けテストに絞りました。
WISCは1949年に初めて作られ、現在まで改訂を重ねています。
改訂の歴史は以下のとおりです。
- 初版:1949年
- WISC-R:1974年
- WISC-III・WISC-IV:1991年
- WISC-V:2014年
さらに、WISCは世界中の研究で使われているため、国をまたいだ比較もしやすいです。
テストを絞ったことで、より正確で信頼性の高い比較が可能になりました。
一種類のテストに統一することが、この研究の強みのひとつです。
知能を6分野に分けて男女差を分析
この研究では、IQをひとつの数値だけで見るのではなく、6つの分野に分けて分析しました。
この分類には「CHC理論」という世界的に広く使われる枠組みが使われています。
CHC理論とは、知能を階層的に整理するための考え方です。
6つの分野は以下のとおりです。
- 流動性知能:初めての問題を論理的に解く力
- 視覚処理:図形や空間を認識する力
- 結晶性知能:これまで学んだ知識・語彙を使う力
- 短期記憶・作業記憶:情報を一時的に保持・操作する力
- 処理速度:簡単な作業を素早くこなす力
- 全検査IQ(平均):全体的な知能の目安
分野を分けて分析することで、初めて見えてくることがあります。
「全体では差がなくても、特定の分野では差がある」という複雑な実態です。
この細かい分類こそが、この研究の核心です。
古いWISCと新しいWISCで結果を比較
テストのバージョンによって、男女差の見え方が変わる可能性があります。
問題の内容や設計が変われば、得点差も変化します。
そのため、この研究ではWISCを「古い版」と「新しい版」に分けて比較しました。
- 古い版:WISCとWISC-R(1974年まで)
- 新しい版:WISC-III・IV・V(1991年以降)
結果として、古い版ほど男女差が大きく出る傾向がありました。
一方、新しい版では差が縮まっています。
テストの設計が、見かけ上の男女差の大きさに影響することが明らかになりました。
「平均の差」だけでは全体像はわからない
IQ平均の男女差を語るとき、多くの研究は「平均点の差」しか見ていません。
しかし、平均だけを見ると大切な情報が抜け落ちます。
たとえば、クラスの平均点が男女で同じでも、点数の広がり方が違えば上位・下位の顔ぶれは変わります。
このように、平均以外の視点も知能の男女差を理解するうえで重要です。
- 平均の差:スコアの中心の値の比較
- ばらつき(分散):スコアが広がっている範囲の違い
特に「変動性仮説(Variability hypothesis)」という考え方では、男性のほうがスコアのばらつきが大きい傾向があるとされています。
この点については、次の章で詳しく説明します。
平均だけでは見えない実態があることを、まず押さえておきましょう。
IQ平均が同じでも分布の形は違う
ばらつきが違えば集団の構成はまったく変わる
IQ平均が同じでも、スコアの広がり方が違えば集団の姿は大きく変わります。
たとえば、男女ともに平均IQが100だとします。
しかし男性のスコアが60〜140に広がっていて、女性が80〜120に集中していたとしたら?
IQ130以上の上位には男性が多く、IQ70以下の下位にも男性が多くなります。
このように「平均は同じでも分布の形が違う」という状況が起こりえます。
- ばらつきが大きい集団:上位・下位に人数が集まりやすい
- ばらつきが小さい集団:平均付近に人数が集中する
つまり、IQ平均の差だけを見て「男女差はない」と結論づけるのは不十分です。
スコアのばらつきの違いも同時に確認する必要があります。
平均とばらつき、この2つをセットで考えることが正確な理解につながります。
変動性仮説とは:男性は極端に高い人も低い人も多い
「変動性仮説(Variability hypothesis)」とは、男性のほうがIQスコアのばらつきが大きいとする考え方です。
この仮説によると、知能が非常に高い人も非常に低い人も、女性より男性に多くなります。
一方で女性は、スコアが平均付近に集中しやすいとされています。
この研究の論文でも、ばらつきを無視することの問題点が明示されています。
変動性仮説の主な内容は以下のとおりです。
- 男性はIQスコアの最上位・最下位に多い
- 女性は平均付近に集中しやすい
よくある質問
IQの性差は遺伝?それとも環境?
現在の研究では、全検査IQの男女差は非常に小さく、その原因を特定するのは困難です。
文化的要因やテストの設計変更で差が変動することから、環境的影響が大きいと考えられています。
効果量d=0.09はどの程度小さいのか
効果量0.09は実質的にほぼ無視できるレベルです。
身長差に例えると約1.4cm程度の差で、日常生活での意味はほとんどありません。
個人差のほうがはるかに大きいのが実際です。
新しいテストで男女差が小さくなる理由
新しいWISCは文化的偏見を排除し、より純粋な認知能力を測定できるよう設計されているためです。
古いテストには意図せずとも性別による有利不利が含まれていた可能性があります。
変動性仮説とは何か
変動性仮説とは、男性のほうがIQスコアのばらつきが大きく、平均は同じでも極端に高い人と低い人の割合が多いという仮説です。
平均差だけでは見えない男女差の側面を説明する重要な視点です。
4万6000人のサンプル数は十分か
非常に大規模です。
この分野では最大級の研究のひとつで、79件の研究を統合したメタ分析により、単独研究では見えない信頼性の高い結果を得ることができています。
分野別に見た男女の違いは?
視覚処理(空間認識)では男性がやや高く、処理速度では女性がやや高い傾向があります。
ただし、どの分野でも差は小さく、個人差のほうが性別による差よりもはるかに大きいのが実情です。

