チャプター8 演習問題

ここまでに学んだ知識を試してみましょう.

ここでは架空のデータセットbreakfast.csvを用います.

このデータセットには,scorewealthbreakfast,そしてabsent_daysという変数が入っています.ある田舎の市の学校の小学6年生に関するデータです.scoreは,学年末の総合学力テストの成績で100点満点です.wealthはその生徒の家計の主たる稼得者の所得です.breakfastはその生徒が朝食をとる回数の一週間あたりの平均です.absent_daysは年間欠席日数です.

あなたは指導教員の先生からリサーチアシスタントを頼まれました.先生から指示された分析を的確にこなし,虎視眈々と共著論文を狙いましょう.

1. メカニズムを考える

教授「うーん,朝食と学力成績ってなんとなく関係がありそうな気がするんだよね.おそらくポジティブな関係があるんちゃうかな.それについての研究をもしかしたらやるかも.ただ,ちょっとボクは忙しいので,君,考えられる因果メカニズムをいくつかまとめといてくれへん?一応,ネガテイブな効果も検討しといて」

2. 記述統計をつくる

教授「すばらしい.仮説はできたやん.次はそれぞれの変数について,平均と標準偏差をまとめておいてくれへん?あと,相関係数もね」

3. 図を描く

教授「やっぱり,数字だけだとわかりづらいねえ.それぞれの変数のヒストラムを作っといてくれる?それから,scoreを縦軸に,それぞれの変数を横軸にして,散布図をつくっといて」

4. 回帰分析をする

教授「さっそく回帰分析をしてみよか.まずは,breakfastで単回帰してから,その後に統制変数を投入してやってみて.結果をきれいにまとめておいて」

5. 結果を解釈する

教授「こんな結果になってしもたんか.ほな,それぞれのモデルについて,解釈を与えておいてください.ほんで,それらを総合して,どういうことが言えそうかまとめといてください」