第2章 データの整理と確率変数の基礎

練習問題 2-1

標本平均,不偏分散,中央値はそれぞれ,mean()var()median()関数で求められます.

mydata <- read.csv("02_practice_01.csv", header = F)

mean(mydata$V1) # 標本平均
## [1] 10
var(mydata$V1) # 不偏分散
## [1] 18.10526
median(mydata$V1) # 中央値
## [1] 10

最頻値を求めるビルトイン関数はRにはありません.例えば次のように関数を定義することで最頻値を求められます3

Mode <- function(x) {
  ux <- unique(x)
  tab <- tabulate(match(x, ux))
  ux[tab == max(tab)]
}

Mode(mydata$V1) # 最頻値
## [1] 10

練習問題 2-3

散布図を書くにはplot()関数を用います.

mydata2 <- read.csv("02_practice_03.csv", header = F)

plot(mydata2$V1, mydata2$V2)

共分散はvar()関数に2つの変数を引数に指定することで求められます.相関係数はcor()関数を用いて求められます.

var(mydata2$V1, mydata2$V2) # 共分散
## [1] 2.111111
cor(mydata2$V1, mydata2$V2) # 相関係数
## [1] 0.7680295

補足

標準偏差はsd()関数で求められます.

sd(mydata$V1)
## [1] 4.255028

ggplot2パッケージを用いれば,もう少しだけ見てくれが良い感じの散布図が簡単に描けます.

library(ggplot2)

ggplot(mydata2, aes(x = V1, y = V2)) +
  geom_point()