第2章データの整理と確率変数の基礎

練習問題 2-1

標本平均，不偏分散，中央値はそれぞれ，mean()，var()，median()関数で求められます．

mydata <- read.csv("02_practice_01.csv", header = F)

mean(mydata$V1) # 標本平均
## [1] 10
var(mydata$V1) # 不偏分散
## [1] 18.10526
median(mydata$V1) # 中央値
## [1] 10

最頻値を求めるビルトイン関数はRにはありません．例えば次のように関数を定義することで最頻値を求められます³．

Mode <- function(x) {
  ux <- unique(x)
  tab <- tabulate(match(x, ux))
  ux[tab == max(tab)]
}

Mode(mydata$V1) # 最頻値
## [1] 10

練習問題 2-3

散布図を書くにはplot()関数を用います．

mydata2 <- read.csv("02_practice_03.csv", header = F)

plot(mydata2$V1, mydata2$V2)

共分散はvar()関数に2つの変数を引数に指定することで求められます．相関係数はcor()関数を用いて求められます．

var(mydata2$V1, mydata2$V2) # 共分散
## [1] 2.111111
cor(mydata2$V1, mydata2$V2) # 相関係数
## [1] 0.7680295

補足

標準偏差はsd()関数で求められます．

sd(mydata$V1)
## [1] 4.255028

ggplot2パッケージを用いれば，もう少しだけ見てくれが良い感じの散布図が簡単に描けます．

library(ggplot2)

ggplot(mydata2, aes(x = V1, y = V2)) +
  geom_point()

https://stackoverflow.com/questions/2547402/is-there-a-built-in-function-for-finding-the-mode を参考にしました．↩︎

第2章 データの整理と確率変数の基礎

練習問題 2-1

練習問題 2-3

補足

第2章データの整理と確率変数の基礎