💨

心理学統計法 R作業メモ

2023/04/25に公開

この ドキュメント は クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンスの下に公開されています。

R> という表記は,Rのコマンドラインの入力を示します.

R言語 操作の基本

変数格納(代入)

<-を使う.
変数A5を代入するとき

A <- 5

とする.

ファイル読み込み

データを格納したファイルを読み込む.
read.csv("ファイル名")を使う.データを変数に格納して,扱いやすくする.
{Fl, Cl, Sax, Ob, Bsn...}を「木管楽器」と呼ぶことにします」みたいなノリ.

dat <- read.csv('week3_1.csv')

のように書く.

読み込んだオブジェクトの取り扱い

datの0こ目の要素は,配列のサイズ.

> dat[0]
 0 列 100 行のデータフレーム 

関数などに与える場合,形式に注意が必要である.

各種関数に食わせられない.
> dat[1]
    setA
1     52
2     50
3     52
4     75
5     67
6     53
7     91
8     27
9     50 
(以下省略)
関数に食わせられる.
> dat$setA
  [1]  52  50  52  75  67  53  91 (以下同様にデータが出力される) 
 [26]  50  24  66  30 122  69  53 
 [51]  24  40  43  59  60  61  21 (以下省略)

dat$setAのように書くのが面倒なので,
A <- dat$setA のようにして,変数に格納してしまうと便利.

配列

インデックス

配列のインデックスは,開始が1なので注意.
正確には,配列の0ばん番目にはデータの型が入るみたい.

> A[0]
integer(0)

呼び出し

1つ
{配列名}[インデックス]
// 例
A[1]
複数
{配列名}[開始:終了]
A[1:5]

授業での使い方

おまじない

csv読み込み
R> read.csv("{ファイル名}")
変数に格納
R> dat <- read.csv("{ファイル名}")
読み込んだ日付データを計算できるように
Time <- as.POSIXct(Et, format = "%H:%M")
data$datetime <- as.POSIXct(data$datetime, format = "%Y-%m-%d %H:%M:%S")

いろいろな計算

平均

\bar{X}=\frac{1}{N}\sum^{N}_{i=1}x_i
平均
R> mean("要素")

標準偏差

データの散らばり具合を調べる

\sigma=\sqrt{\frac{1}{N}\sum^{N}_{i=1}(x_i-\bar{X})^2}

標準偏差
R> sd("要素")

中央値

中央値
R> median("要素")

四分位数

四分位数
R> quantile("要素")

範囲

範囲
R> range("要素")

相関係数

相関係数
R> cor("要素1", "要素2")

グラフの描画

ヒストグラムの作成
R> hist("要素")
散布図
R> plot("要素1", "要素2")
箱ひげ図
R> boxplot("要素")

注意したいこと

RStudioのデスクトップ版で,うまくファイルが読み込めないときは,絶対パスを指定してみると良い

Discussion