チャプター8 演習問題
ここまでに学んだ知識を試してみましょう.
ここでは架空のデータセットbreakfast.csv
を用います.
このデータセットには,score
,wealth
,breakfast
,そしてabsent_days
という変数が入っています.ある田舎の市の学校の小学6年生に関するデータです.score
は,学年末の総合学力テストの成績で100点満点です.wealth
はその生徒の家計の主たる稼得者の所得です.breakfast
はその生徒が朝食をとる回数の一週間あたりの平均です.absent_days
は年間欠席日数です.
あなたは指導教員の先生からリサーチアシスタントを頼まれました.先生から指示された分析を的確にこなし,虎視眈々と共著論文を狙いましょう.
1. メカニズムを考える
教授「うーん,朝食と学力成績ってなんとなく関係がありそうな気がするんだよね.おそらくポジティブな関係があるんちゃうかな.それについての研究をもしかしたらやるかも.ただ,ちょっとボクは忙しいので,君,考えられる因果メカニズムをいくつかまとめといてくれへん?一応,ネガテイブな効果も検討しといて」
2. 記述統計をつくる
教授「すばらしい.仮説はできたやん.次はそれぞれの変数について,平均と標準偏差をまとめておいてくれへん?あと,相関係数もね」
3. 図を描く
教授「やっぱり,数字だけだとわかりづらいねえ.それぞれの変数のヒストラムを作っといてくれる?それから,score
を縦軸に,それぞれの変数を横軸にして,散布図をつくっといて」
4. 回帰分析をする
教授「さっそく回帰分析をしてみよか.まずは,breakfast
で単回帰してから,その後に統制変数を投入してやってみて.結果をきれいにまとめておいて」
5. 結果を解釈する
教授「こんな結果になってしもたんか.ほな,それぞれのモデルについて,解釈を与えておいてください.ほんで,それらを総合して,どういうことが言えそうかまとめといてください」