🔰

【R超初心者】inputデータについて

2023/11/16に公開

環境

Windows10
R 4.3.1
Rstudio

概要

Rはとにもかくにもinputデータが非常に大切ですがinputデータに関してあまり詳しく書かれているものがあまりありません。
wetのR初心者としてはそれはかなりつらいところ。
どんなinputが必要なのか本当にわからない。本当に。
どういった形のデータがあるのか、良く使用される例を紹介します。
(他の記事を書くときに使用したデータセットは順次ここに追記します。)

データセット

R自体にはもともと標準データセットがたくさん用意されています。
https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html

iris

iris という、アヤメという植物の分類データセットをよく皆さん使用されているが実際どんなデータなのか確認しました。

head(iris)
 Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa

なんとなくわかるけど見慣れてないのでしんどい。

View(iris)


(途中省略)

エクセルみたいな表で見ると落ち着く。
個人的にはSpeciesが一番左にある方が好きだけど、Rは行名の重複を許さないので列名は数字になってるみたい。なるほど。

mtcars

2024/01/18追記。
これもまたよく使用されるRに元から入っているデータセット。
MazdaやHondaがあることからわかるように、自動車の燃費や性能のデータらしい。

head(mtcars)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
View(mtcars)

Discussion