教材(高校数学I):身長と相関のあるデータの分析

ここでは、生徒の皆さんがセンサス@スクールのオンライン調査に参加して入力したデータを分析する方法について解説しています。

 グラフの描画のしかたについては、使い方のページを参照してください。

 身長と両手を広げた長さとは関係があると言われています。身長が両腕の長さや足の大きさなどの長さと関係があるのかを調べ、学年や性別でどのような違いがあるのかを分析します。散布図、ヒストグラム、箱ひげ図などを用います。データは2009年からのものと2013年からのものと2種類がありますが、2009年のデータから150人分抽出します。ただし、抽出はランダムにされますので、抽出するたびに結果が少し異なることがあります。

 変数の選択では、以下の6つの変数を選択しておきます。
    Q01.性別、Q08.身長、Q09.へその高さ、Q10.両腕の長さ、Q11.右足のサイズ、Q15.学年

身長と両腕の長さの散布図:
 最初に、身長と両腕の長さの散布図を描いてみます。


 軸の範囲を指定しないと、値として問題のあるデータが表示されますので、最小値を130cm、最大値を180cmにして再描画してみます。

この散布図を見ると、身長と両腕の長さには関係がありそうです。

身長と右足のサイズの散布図:
 つぎに、同じように軸の範囲を指定して、身長と右足のサイズの散布図を描きます。

身長と右足のサイズの間にも関係がありそうですが、身長と両腕の長さの関係の方が強いように見えます。
Page Top  
 つぎに、相関係数を計算したり、グループ別にグラフを表示して、いろいろな角度から分析してみます。

  1. 相関係数を計算します
  2. 性別で分析します
  3. 学年別に分析します
  4. 帯グラフやクロス表で分析します

1.相関係数を計算します

関係の強さを見るための指標として相関係数があります。センサス@スクールでは相関係数を計算することができないので、EXCELを用いて計算することにします。

 データの抽出の後に以下のようなメニューが表示されます。グラフの描画をする前に、「csv形式抽出ファイルをダウンロードする」というボタンを押すことにより、EXCELが起動してデータが表示されます。


 以下のようにEXCELが起動して、抽出されたデータが表示されます。ただし、使用しているコンピュータにEXCELが入っていることが必要です。



EXCELでは、以下の手順で相関係数を計算します。

  1. 第1行目の変数名が常に表示されるように、ウィンドウ枠の固定をします。
  2. Q08.身長のデータをソートして、130~180cmの値の人だけを残して他を削除します。
  3. Q10.両腕の長さのデータをソートして、130~180cmの値の人だけを残して他を削除します。
  4. Q11.右足のサイズのデータをソートして、15~30cmの値の人だけを残して他を削除します。
  5. EXCELのCORREL関数を用いて、身長と両腕の長さの相関係数を計算します。
  6. EXCELのCORREL関数を用いて、身長と右足のサイズの相関係数を計算します。

a. 第1行目の変数名が常に表示されるように、ウィンドウ枠の固定をします。
 EXCELのメニューで、表示からウィンドウ枠の固定を選び、先頭行の固定をクリックします。そうすると、スクロールしても第1行目がいつも表示されるようになります。


 b. Q08.身長のデータをソートして、130~180cmの値の人だけを残して他を削除します。
 EXCELのメニューで、データから並べ替えを選びます。


 ソートするキーを指定するメニューが表示されますので、Q08. 身長を選びます。


Q08. 身長の値が130よりも小さい人を削除します。下の画面では、2行目から6行目の人が小さいので、2行目から6行目を反転させ、マウスの右ボタンを押すと、下のようなメニューがでますので、削除を選び、5人分削除します。つぎに、180cmよりも大きな人を同じようにして削除します。



 同様に、Q10.両腕の長さもデータをソートして、削除機能により130~180cmの値の人だけを残します。さらに、Q11.右足のサイズのデータをソートして、削除機能により15~30cmの値の人だけを残して他を削除します。
e. EXCELのCORREL関数を用いて、身長と両腕の長さの相関係数を計算します。
 最初に、両腕の長さの列のデータの後ろに、「=」を入力します。


 EXCELのメニューで、「数式」から「その他の関数」、「統計」、「CORREL」を選択します。


 下のようなメニューが表示されるので、配列1に身長の列のデータ、配列2に両腕の長さの列のデータが対応するようにします。


 上のメニューの配列1の右側にあるボタン(=の左側)を押して、表の身長の列をマウスでドラッグします。


 同じように、配列2の右側のボタンを押して、両腕の長さの列をマウスでドラッグします。下のメニューのように、値が入ったらOKボタンを押します。


 =を入力したセルに、0.807935という値が計算されます。この値が、身長と両腕の長さの相関係数です。


 同じようにして、EXCELのCORREL関数により、身長と右足のサイズの相関係数を計算します。


 身長と右足のサイズの相関係数は、0.668259になりました。相関係数は、-1から+1までの値をとり、0の場合は相関はなく、+1の場合は強い相関(一方が増えると他方も増える)があり、-1の場合は反対の相関が強い(一方が増えると他方が減る)といえます。

 散布図と相関係数の値を比べてみましょう。身長と両腕の長さの散布図は対角線に近い分布をしており、相関係数は0.807935でした。身長と右足のサイズの散布図は、両腕の長さのときよりも散らばりが大きく、相関係数は0.668259でした。このことから、身長と両腕の長さとの関係の方が、身長と右足のサイズの関係よりも強いといえます。


Page Top  

2.性別で分析します

 つぎに性別による違いがあるかどうかを見てみます。関係の強さについては、全体の場合とあまり変わりませんが、男の子の方が女の子に比べて身長が高い人が多いことが分かります。



 身長と右足のサイズの場合も、身長と両腕の長さの場合と同じように見えます。



Page Top 

3.学年別に分析します

散布図を学年別で見てみます。

 中学2年や大学生は人数が少ないので表示していません。学年別に見た場合、学年が高くなるにしたがって、身長が高い人の割合が増えていくことが分かります。







Page Top  

4.帯グラフやクロス表で分析します

人数を確認するために、学年と性別との関係を見てみましょう。散布図では、身長の場合に130cmから180cmに限定しましたが、帯グラフでは範囲を限定していないことに注意してください。



帯グラフでは割合を見るので人数などの件数は分かりません。クロス表を見ることにより件数を正確に知ることができます。学年によって人数にばらつきがあることがわかります。

Q15.学年/Q01.性別   女の子  男の子 合計 
 小学4年以下   12   15  27
 中学1年   14   7  21
 中学2年   1   0  1
 中学3年   21   22  43
 大学生   7   13  20
 小学5年   7   9  16
 小学6年   8   6  14
 その他   0   1  1
 合計  70  73  143



Page Top