「男子は理系、女子は文系」という言葉を、一度は耳にしたことがあるのではないでしょうか。
テストの点数や成績を見て、「やっぱり男女で得意なことが違う」と感じた経験がある人も多いはずです。 IQの性差、つまり男女の知能の違いについては、長年にわたってさまざまな議論が続いてきました。
従来は、「全体的な知能(IQ)において男性のほうがわずかに高い」と考えられてきた時期もありました。 しかし近年の大規模な研究では、その通説が大きく揺らいでいます。
論文のタイトルは「知能における性差の行き詰まり:WISCバッテリーを用いたメタ分析」で、学術誌『教育心理学レビュー(Educational Psychology Review)』に2022年に掲載されました。 79件の研究・4万6000人以上のデータを統合した、この分野では最大規模の分析のひとつです。
今回も、性格研究者で悪者図鑑著者のトキワ(@etokiwa999)が解説していきます。
※HEXACO-JP性格診断を開発しました!MBTIより科学的根拠があります。詳細は以下タップしてください。

目次
IQの性差を調べた研究はどんな内容だったのか
79件の研究・4万6000人分のデータを使った大規模な分析
この研究は、79件の論文をまとめて分析した大規模なものです。 このような手法を「メタ分析」と呼びます。 メタ分析とは、複数の研究を統合してより確かな結論を導く方法です。 参加者の合計は4万6605人にのぼります。 内訳は男性2万3404人・女性2万3201人です。
分析に使われたデータの規模は以下のとおりです。
- 研究数:79件(1961〜2019年発表)
- 参加者総数:4万6605人
- 独立した標本数:134
- 効果量(差の大きさを示す値):640個
つまり、1つの研究では見えにくい「本当の差」を、膨大なデータで明らかにしようとしました。 データ数が多いほど、結果の信頼性は高まります。 この研究の規模は、知能の男女差を扱った研究の中でも特に大きな部類です。
子ども向け知能テスト「WISC」に絞って調べた理由
この研究は、「WISC(ウィスク)」という知能テストだけを対象にしています。 もしあなたが研究者だとしたら、どのテストを使って調べますか? 異なるテストを混在させると、結果の比較が難しくなります。 そこでこの研究では、世界で最も広く使われる子ども向けテストに絞りました。 WISCは1949年に初めて作られ、現在まで改訂を重ねています。
改訂の歴史は以下のとおりです。
- 初版:1949年
- WISC-R:1974年
- WISC-III・WISC-IV:1991年
- WISC-V:2014年
また、WISCは世界中の研究で使われているため、国をまたいだ比較もしやすいです。 テストを絞ったことで、より正確で信頼性の高い比較が可能になりました。 一種類のテストに統一することが、この研究の強みのひとつです。
知能を6つの分野に分けて男女差を整理した方法
この研究では、知能をひとつの数値だけで見るのではなく、6つの分野に分けて分析しました。 この分類には「CHC理論」という世界的に広く使われる枠組みが使われています。 CHC理論とは、知能を階層的に整理するための考え方です。 6つの分野は以下のとおりです。
- 流動性知能:初めての問題を論理的に解く力
- 視覚処理:図形や空間を認識する力
- 結晶性知能:これまで学んだ知識・語彙を使う力
- 短期記憶・作業記憶:情報を一時的に保持・操作する力
- 処理速度:簡単な作業を素早くこなす力
- 全検査知能指数:全体的な知能の目安
しかし、これらを分けて分析することで、初めて見えてくることがあります。 「全体では差がなくても、特定の分野では差がある」という複雑な実態です。 この細かい分類こそが、この研究の核心です。
古いWISCと新しいWISCで結果が変わるかどうかも検証した
同じ「男女差」でも、テストのバージョンによって結果が変わる可能性があります。 もしあなたが10年前のテストと今のテストを受けたとしたら、結果は同じでしょうか? 問題の内容や設計が変われば、得点差も変化します。 そのため、この研究ではWISCを「古い版」と「新しい版」に分けて比較しました。
- 古い版:WISCとWISC-R(1974年まで)
- 新しい版:WISC-III・IV・V(1991年以降)
結果として、多くの分野で古い版ほど男女差が大きく出る傾向がありました。 一方、新しい版では差が縮まっています。 テストの設計が、見かけ上の男女差の大きさに影響することが明らかになりました。
「平均の差」だけを見ていては男女差の全体像はつかめない
男女の知能差を語るとき、多くの研究は「平均点の差」しか見ていません。 しかし、平均だけを見ると大切な情報が抜け落ちます。 たとえば、クラスの平均点が男女で同じでも、点数の広がり方が違えば、上位・下位の顔ぶれは変わります。 このように、平均以外の視点も知能の男女差を理解するうえで重要です。
- 平均の差:スコアの中心の値の比較
- ばらつき(分散):スコアが広がっている範囲の違い
特に「変動性仮説(Variability hypothesis)」という考え方では、男性のほうがスコアのばらつきが大きい傾向があるとされています。 この点については、次の章で詳しく説明します。 平均だけでは見えない実態があることを、まず押さえておきましょう。
IQの性差を正しく理解するカギ:平均が同じでも分布の形は違う
平均点が同じでも「ばらつき」が違えば集団の構成はまったく異なる
平均が同じでも、スコアの広がり方が違えば、集団の姿は大きく変わります。 たとえば、男女ともに平均IQが100だとします。 しかし男性のスコアが60〜140に広がっていて、女性が80〜120に集中していたとしたら? IQ130以上の上位には男性が多く、IQ70以下の下位にも男性が多くなります。 このように「平均は同じでも分布の形が違う」という状況が起こりえます。
- ばらつきが大きい集団:上位・下位に人数が集まりやすい
- ばらつきが小さい集団:平均付近に人数が集中する
つまり、平均の差だけを見て「男女差はない」と結論づけるのは不十分です。 スコアのばらつきの違いも同時に確認する必要があります。 平均とばらつき、この2つをセットで考えることが正確な理解につながります。
変動性仮説とは:男性はスコアが極端に高い人も低い人も多いという考え方
「変動性仮説(Variability hypothesis)」とは、男性のほうがスコアのばらつきが大きいとする考え方です。 この仮説によると、知能が非常に高い人も非常に低い人も、女性より男性に多くなります。 一方で女性は、スコアが平均付近に集中しやすいとされています。 この研究の論文でも、ばらつきを無視することの問題点が明示されています。
変動性仮説の主な内容は以下のとおりです。
- 男性は知能スコアの最上位・最下位に多い
- 女性は平均付近に集中しやすい
- 平均の差が小さくても、極端な領域では男女比が偏る
たとえば知能が非常に高い集団では、男性の割合が高くなる可能性があります。 逆に知能が非常に低い集団にも、男性が多くなる可能性があります。 この仮説は、平均の差だけでは見えない男女差の一面を説明するものです。

平均の差がゼロ近くても、上位・下位に男女の比率が偏る理由
男女の平均点がほぼ同じでも、上位・下位の人数比が偏ることがあります。 もしあなたが学校の模試を思い浮かべるなら、こんな場面を想像してください。 クラスで男女の平均点が同じでも、上位10名の顔ぶれに偏りがある経験はありませんか? これは、平均の差ではなくばらつきの差によって引き起こされます。 スコアが広く分布している集団は、極端な高得点・低得点に人数が集まりやすいです。
- 平均の差が小さい→全体ではほぼ同等に見える
- ばらつきの差が大きい→上位・下位の人数に偏りが生まれる
このため、知能の男女差を語るとき、平均だけでなくスコアの広がり方を見ることが重要です。 ただし、この研究自体はばらつきの直接分析を主な目的としていません。 ばらつきの問題は、今後の研究でさらに詳しく検討される必要があると論文は指摘しています。
多くの研究が平均の差しか分析せず、ばらつきを無視してきた問題点
これまでの多くの研究では、男女の知能差を「平均点の比較」だけで語ってきました。 しかしそれだけでは、男女差の全体像をとらえることはできません。 論文でも「ほとんどの研究が平均の差しか見ておらず、ばらつきを無視してきた」と明記されています。 ばらつきを見ない分析は、重要な情報を見落としている可能性があります。
これまでの主な問題点は以下のとおりです。
- 平均の差だけを比較してきた
- スコアのばらつき(分散)を分析していない
- 上位・下位の人数の偏りが見落とされてきた
加えて、使用するテストの種類や標本の偏りも結果に影響します。 一国だけのデータや少数の標本では、結果の代表性が低くなります。 こうした方法論的な問題が、これまでの研究結果が一致しなかった原因のひとつです。
変動性仮説の視点を加えることで「男女差はない」という結論が一面的になる理由
「全検査IQに男女差はほぼない」という結論は、平均だけを見た場合の話です。 変動性仮説の視点を加えると、この結論は一面的になります。 なぜなら、平均が同じでもばらつきが違えば、集団の構成はまったく異なるからです。 「平均に差がない=男女の知能は完全に同じ」とは言えません。
視点によって見えてくるものは変わります。
- 平均の差だけで見ると:男女差はほぼなし
- ばらつきの差を加えると:上位・下位の人数比に偏りが生まれる可能性がある
それゆえ、知能の男女差を理解するには、平均とばらつきの両方を確認する必要があります。 この研究は主に平均の差を分析したものですが、ばらつきの視点の重要性も指摘しています。 男女差を「ある・なし」の2択で語ることの危うさを、変動性仮説は示しています。
IQの性差の全体像:全検査IQの平均差はほぼゼロに近い
全検査IQの男女差はIQ約1.4点分と非常に小さかった
全検査IQの男女差は、IQ約1.4点分と非常に小さな値でした。 効果量(差の大きさの目安)はd = 0.09です。 これは「ほぼ無視できるレベル」とされています。 統計的には有意な差として検出されましたが、実際の意味はほとんどありません。 標準化標本だけで分析しても、d = 0.10とほぼ同水準でした。
- 全体の効果量:d = 0.09(男性がわずかに高い)
- IQ換算での差:約1.4点
- 統計的有意性:あり(p < 0.001)
- 実質的な意味:ほぼなし
つまり、全検査IQにおける男女差は、統計上は確認されるものの日常的な意味ではほとんどありません。 この差は非常に小さく、個人差のほうがはるかに大きいことを忘れてはなりません。 全体の知能差よりも、分野ごとの違いに目を向けることが重要です。
新しいバージョンのテストでは差がさらに縮まり統計的に消えた
新しいWISC(WISC-III・IV・V)だけに絞ると、差はさらに小さくなります。 効果量はd = 0.054まで下がります。 IQ換算では約0.81点の差にとどまります。 さらに、統計的にも有意な差とはみなされませんでした。
- 新しい版のみでの効果量:d = 0.054
- IQ換算での差:約0.81点
- 統計的有意性:なし(p = 0.13)
しかし、なぜ新しいバージョンでは差が縮まるのでしょうか。 それは、新しいテストがより「純粋な認知能力」を測る課題を採用しているためと考えられています。 テストの設計が変わることで、見かけ上の男女差も変化することがわかります。
流動性知能(論理的な問題解決力)でも男女の平均差はほとんどなかった
流動性知能とは、初めて見た問題をその場で論理的に解く力のことです。 もしあなたが初めて見るパズルを自力で解くとしたら、それが流動性知能を使う場面です。 この分野での男女差は、効果量d = 0.09で全検査IQとほぼ同水準でした。 新しいバージョンだけで見ると、d = 0.05とさらに小さくなり、有意差は消えます。
- 流動性知能の効果量:d = 0.09(男性がわずかに高い)
- 新しいバージョンのみ:d = 0.05(統計的に非有意)
- マトリックス推理課題:d = −0.04(女性がわずかに高い、非有意)
とりわけ、流動性知能を最もよく測るとされる「マトリックス推理」では差はほぼゼロでした。 この結果は、男女の論理的思考力に本質的な差はないことを示唆しています。 流動性知能は全体の知能と最も関連が深いため、この結果は特に重要です。
男女それぞれの得意・不得意が打ち消し合うことで全体IQに差が出にくい
全検査IQで男女差がほぼないのは、得意な分野と苦手な分野が互いに相殺されるからです。 男性は視覚処理や結晶性知能でやや高い傾向があります。 一方で女性は処理速度で大きく優位に立ちます。 これらが合計されると、全体のIQスコアは近い値に収まります。
- 男性が優位な分野:視覚処理(約3.1点分)、結晶性知能(約2.1点分)
- 女性が優位な分野:処理速度(約5.5点分)
このように、分野別の差が全体では相殺されるため、全検査IQの差は小さくなります。 「男女の知能は同じ」ではなく「得意な分野が違う」という理解が正確です。 各分野の差を個別に見ることが、男女の知能の実態を理解する近道です。
古いテストほど男女差が大きく見えてしまう理由
WISCの古いバージョンを使った研究ほど、男女差が大きく検出される傾向がありました。 たとえば処理速度では、古い版での効果量はd = −0.46でした。 ところが新しい版ではd = −0.26まで縮まっています。 なぜこのような違いが生まれるのでしょうか。 新しいテストでは、男女間でスコアが偏りやすい問題が取り除かれる傾向があります。
- 古いバージョン:男女差が全体的に大きい
- 新しいバージョン:男女差が全体的に縮小している
また、新しいテストはCHC理論にもとづいて設計されており、より純粋な認知能力を測ります。 そのため、古い研究の結果をそのまま現代に当てはめることには注意が必要です。 テストのバージョンは、男女差の大きさに重要な影響を与える要因のひとつです。
IQの性差が見られる分野:男性が得意なこと・女性が得意なこと
視覚・空間処理では男性がIQ約3点分優位という結果が出た
視覚処理(図形・空間の認識力)では、男性が女性よりIQ約3.1点分高い結果でした。 効果量はd = 0.21で、「小〜中程度の差」に分類されます。 この結果は、26件の研究・3万9000人以上のデータをもとにしています。 標準化標本のみでの分析でもd = 0.17と、同様の傾向が確認されました。
- 効果量:d = 0.21(95%信頼区間:0.16〜0.25)
- IQ換算での差:約3.1点(男性優位)
- 新しいバージョンのみ:d = 0.183
また、この差はWISCの古いバージョンでも新しいバージョンでも、ほぼ同じ大きさで安定していました。 視覚処理の男性優位は、この研究で確認された男女差の中でも最も安定したものの一つです。 空間認識力の男性優位は、他の研究との結果とも一致しています。
積み木模様課題の男性優位は新旧どのバージョンでも安定して見られた
「積み木模様」課題とは、図形を見てブロックで同じ形を作る問題です。 もしあなたが幼いころにブロック遊びをしたなら、それに近いイメージです。 この課題は、視覚処理と空間認識の両方を使います。 積み木模様での男性優位(d = 0.206)は、WISCのすべてのバージョンで安定して見られました。
- 積み木模様の効果量:d = 0.206(男性優位)
- 新しいバージョンのみ:d = 0.196(ほぼ同水準を維持)
この課題は、視覚運動協調、心的回転(頭の中で図形を回す力)、空間的な記憶などと深く関連しています。 さらに積み木模様は、WISCの新旧すべてのバージョンに含まれる数少ない課題です。 そのため時代を超えた比較に適した指標として、特に重要な意味を持っています。
結晶性知能(知識・語彙)でも男性がわずかに高い傾向が確認された
結晶性知能とは、これまでに学んだ知識や語彙を使う力のことです。 学校で習った内容を問われるようなテストで使われる能力のイメージです。 この分野では、男性が女性よりIQ約2.1点分高い傾向がありました(d = 0.137)。 ただし、これは「小さな差」の範囲に収まります。
サブテストを細かく見ると、課題によって差の大きさが異なります。
- 知識(一般的な知識を問う問題):d = 0.263(差が最も大きい)
- 語彙:d = 0.138(小さな差)
- 理解:d = 0.096(小さな差)
- 類似(言葉の共通点を探す問題):d = 0.033(差はほぼなし)
言語を使う課題では通常女性が優位とされますが、この結果は逆の傾向を示しています。 著者らはこの点を「特に興味深い謎」として、今後のさらなる研究が必要だと述べています。 語彙・知識課題での男性優位の原因は、現時点では明確に説明できていません。
処理速度では女性がIQ約5.5点分と最も大きな差で優位だった
処理速度とは、簡単な作業を素早く正確にこなす力のことです。 この分野では、女性がIQ約5.5点分高いという結果が出ました(d = −0.366)。 これは、この研究で分析したすべての分野の中で最大の男女差です。 34件の研究・2万6000人以上のデータで確認された、信頼性の高い結果です。
- 効果量:d = −0.366(女性優位)
- IQ換算での差:約5.5点(女性が高い)
- 新しいバージョンのみ:d = −0.264(IQ換算で約4.0点)
加えて、この女性優位はほぼすべての研究で例外なく確認されています。 著者らは、単純で反復的な作業を長時間続けるときの男性の集中力の維持が、一因かもしれないと述べています。 処理速度の女性優位は、今回の分析の中で最も一貫性の高い結果のひとつです。
符号課題は全サブテスト中で男女差が最も大きく、女性が圧倒的に速かった
「符号」課題とは、数字と記号を対応させて素早く書き写す問題です。 もしあなたが、決められたルールに沿って同じ作業をひたすら繰り返すとしたら、それが符号課題のイメージです。 この課題での女性優位(d = −0.419)は、WISCの全サブテスト中で最大の男女差です。 新しいバージョンでもd = −0.333と、依然として大きな差が残っています。
- 符号課題の効果量:d = −0.419(女性優位・全サブテスト中最大)
- 新しいバージョンのみ:d = −0.333(依然として大きな差)
- 同じ処理速度の「記号探し」課題:d = −0.149(差は小さめ)
符号課題はWISC-III・IV・Vのすべてに含まれており、継続的に女性優位が確認されています。 それゆえ、この差の大きさは全検査IQの算出にも影響している可能性があると著者らは指摘しています。 符号課題での女性優位の大きさは、知能の男女差を語るうえで見逃せない事実です。
最後に
この記事では、4万6000人以上のデータをもとにした大規模な研究をもとに、知能の男女差を詳しく見てきました。 結果をひとことでまとめると、「全体のIQに男女差はほぼなく、得意な分野が違う」ということです。
男性は視覚処理(空間認識)や結晶性知能(知識・語彙)でわずかに高い傾向があります。 一方で女性は、処理速度において全分野の中で最も大きな差で優位に立っています。 これらが互いに打ち消し合うことで、全体のIQスコアはほぼ同水準になります。
また、平均が同じでも「スコアのばらつき」が異なれば、上位・下位の男女比は変わってきます。 「男女差はない」という一言では語れない、複雑な実態があることを忘れないでください。
さらに重要なのは、新しいテストほど男女差が縮小しているという事実です。 テストの設計や時代背景も、見かけ上の男女差に大きく影響しています。
「男子だから理系が得意」「女子だから文系向き」という思い込みは、データが示す現実とはかけ離れています。 個人差は男女差よりもはるかに大きく、自分の可能性を性別で決めつける必要はまったくありません。

ライター 兼 編集長:トキワエイスケ @etokiwa999
株式会社SUNBLAZE代表。子どもの頃、貧困・虐待家庭やいじめ、不登校、中退など社会問題当事者だったため、社会問題を10年間研究し自由国民社より「悪者図鑑」出版。その後も社会問題や悪者が生まれる決定要因(仕事・教育・健康・性格・遺伝・地域など)を在野で研究し、論文4本執筆(うち2本ジャーナル掲載)。社会問題の発生予測を目指している。凸凸凸凹(WAIS-Ⅳ)。







