🍣

【統計学】R言語まとめ1

2024/04/21に公開

背景

自分がどうしてもやりたいと思っているAIの現場に参画するために、一つずつ基礎を積み上げていく必要に迫られています。

Rの使い方

# 足し算は以下で入力
1 + 2
# 3と出力
# コメントは#をつけると記載が可能
# 平方根は
sqrt(16)
# 4と出力

対数は以下

dateは以下

# 数値配列の作成
数値配列 <- c(1, 2, 3, 4)

# 数値配列に対する統計値を簡単に取得する
summmary(数値配列)

https://mi-chan-nel.com/summary-function-in-r/

# 行列の作成
matrix(c(1, 2, 3, 100, 110, 120), 3, 2)

# ファイルの読み込み
read.csv(ファイル名)

# 分散を求める関数
var()
# 関数の書き方
平均 <- function(x) {
  平均の値 <- sum(x) / length(x)
  平均の値
}

# 現在のディレクトリの確認
getwd()

作業ディレクトリを変更するには
①その他を選択
②作業ディレクトリの変更を選択
③選びたいディレクトリを選択

# 現在のディレクトリのファイルを取得するには
list.files()
# ソースファイルを読み込むには
source("ファイル名.R")
# 度数分布表の作成
身長 <- c(100, 200, 100, 200, 300)
table(身長)

C()・・・データを結合する役割を果たす

# ヒストグラムを描く
hist(身長)

様々な関数を扱う

数の集合 <- c(10,11,12,13)
# 合計を計算する
sum(数の集合)
# 平均を出す
sum(数の集合) / length(数の集合)
# 最初から平均を出す
mean(数の集合)
# 中央値を出す
median(数の集合)
# 分散を出していく
数の平均 <- mean(数の集合)
平均の偏差 <- 数の集合 - 数の平均
偏差の二乗 <- 平均の偏差 ^ 2
偏差の二乗和 <- sum(偏差の二乗)
分散 <- 偏差の二乗和 / length(数の集合)
sqrt(分散)
# 分散
var(数の集合)
# ただしこちらは不偏分散で値が異なるとのことです。
# 元に戻したい場合は
var(数の集合) * (length(数の集合)-1) / length(数の集合)

# また標準偏差はsd()という関数があるとのこと
# ただしこちらも不偏分散とのこと

絶対値の値を取得するにはabs()を用いるとのこと

最大値の取得はmax()

最小値はmin()

https://bellcurve.jp/statistics/glossary/996.html

Discussion