知識問題
パネルデータの特徴は何か、簡単に述べてください。
パネルデータ分析の利点は何か、述べてください。
パネルデータ分析の3つのモデルを列挙し、それぞれの概要を述べてください。
それぞれの路線において、市場集中度が高いほど、 運賃が高くなる傾向にあるのでは?
という仮説を検証してください。
この問題では以下のライブラリを使用するため、読み込むこと
library(tidyverse)
library(lfe)
library(fixest)
library(wooldridge)
library(ggplot2)
この問題では以下のデータを使用するため、読み込むこと
データの読み込み
data("airfare")
summary(airfare)
## year id dist passen
## Min. :1997 Min. : 1 Min. : 95.0 Min. : 2.0
## 1st Qu.:1998 1st Qu.: 288 1st Qu.: 505.0 1st Qu.: 215.0
## Median :1998 Median : 575 Median : 861.0 Median : 357.0
## Mean :1998 Mean : 575 Mean : 989.7 Mean : 636.8
## 3rd Qu.:1999 3rd Qu.: 862 3rd Qu.:1304.0 3rd Qu.: 717.0
## Max. :2000 Max. :1149 Max. :2724.0 Max. :8497.0
## fare bmktshr ldist y98 y99
## Min. : 37.0 Min. :0.1605 Min. :4.554 Min. :0.00 Min. :0.00
## 1st Qu.:123.0 1st Qu.:0.4650 1st Qu.:6.225 1st Qu.:0.00 1st Qu.:0.00
## Median :168.0 Median :0.6039 Median :6.758 Median :0.00 Median :0.00
## Mean :178.8 Mean :0.6101 Mean :6.696 Mean :0.25 Mean :0.25
## 3rd Qu.:225.0 3rd Qu.:0.7531 3rd Qu.:7.173 3rd Qu.:0.25 3rd Qu.:0.25
## Max. :522.0 Max. :1.0000 Max. :7.910 Max. :1.00 Max. :1.00
## y00 lfare ldistsq concen
## Min. :0.00 Min. :3.611 Min. :20.74 Min. :0.1605
## 1st Qu.:0.00 1st Qu.:4.812 1st Qu.:38.75 1st Qu.:0.4650
## Median :0.00 Median :5.124 Median :45.67 Median :0.6039
## Mean :0.25 Mean :5.096 Mean :45.28 Mean :0.6101
## 3rd Qu.:0.25 3rd Qu.:5.416 3rd Qu.:51.45 3rd Qu.:0.7531
## Max. :1.00 Max. :6.258 Max. :62.57 Max. :1.0000
## lpassen
## Min. :0.6931
## 1st Qu.:5.3706
## Median :5.8777
## Mean :6.0170
## 3rd Qu.:6.5751
## Max. :9.0475
#ggplotを活用する
hg_fare <- ggplot(data=airfare,aes(x=fare))+geom_histogram()
hg_fare
#例えば、data1というデータフレームに、numberという変数をIn_numberに対数変換して追加する時
data1$In_number <- log(data1$number)
#基本的な関数
data(trade)
model1 = feols(y ~ x1+x2+x3+x4 | id+firm+year+group, trade)
パイプの前には変数、パイプの後に固定効果を置く x1, x2, x3, x4 : 回帰させたい変数
id, firm, year, group : 固定効果
trade : サンプルで扱っているデータ
※以下はtradeという別分析の結果
出力
summary(model2)
## GLM estimation, family = gaussian, Dep. Var.: Euros
## Observations: 38,325
## Fixed-effects: Origin: 15, Destination: 15, Product: 20, Year: 10
## Standard-errors: Clustered (Origin)
## Estimate Std. Error t value Pr(>|t|)
## log(dist_km) -66754618 14306507 -4.66603 0.00036385 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Log-Likelihood: -766,357.9 Adj. Pseudo R2: 0.008938
## BIC: 1,533,328.0 Squared Cor.: 0.304899
etable(model2)
## model2
## Dependent Var.: Euros
##
## log(dist_km) -66,754,618.0*** (14,306,507.4)
## Fixed-Effects: ------------------------------
## Origin Yes
## Destination Yes
## Product Yes
## Year Yes
## _______________ ______________________________
## S.E.: Clustered by: Origin
## Observations 38,325
## Squared Cor. 0.30490
## Pseudo R2 0.00901
## BIC 1,533,328.0
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
fixed_effect <- fixef(model2)
summary(fixed_effect)
## Fixed_effects coefficients
## Origin Destination Product Year
## Number of fixed-effects 15 15 20 10
## Number of references 0 1 1 1
## Mean 3.9e+08 88900000 24300000 8140000
## Standard-deviation 45400000 4.2e+07 38500000 6020000
##
## COEFFICIENTS:
## Origin: AT BE DE DK ES
## 350900000 389800000 447100000 370300000 443400000 ... 10 remaining
## -----
## Destination: AT BE DE DK ES
## 52280000 74990000 175700000 56720000 110700000 ... 10 remaining
## -----
## Product: 1 2 3 4 5
## 0 100100000 35740000 103800000 -22420000 ... 15 remaining
## -----
## Year: 2007 2008 2009 2010 2011
## 0 3567000 246700 3756000 7927000 ... 5 remaining
指定のエクセルデータにおいて、独立変数を職能資格等級、被説明変数を業績給として、
仮説を立て、その仮説を固定効果モデルによって検証してください。
やり方
分析するデータファイルをRに読み込む(openxlsxライブラリ等を活用する)
変数と固定効果を特定する
欠損値を処理する
必要に応じて、変数の対数変換を行う
固定効果モデルの推定を行う
結果を表示する 等級の変化が業績給に対してどのような影響を与えているか、分析結果を解釈してください。