😎

R言語(Rstudio)環境の構築・簡単な関数の使い方

2020/09/25に公開

LinuCエヴァンジェリストの鯨井貴博@opensourcetechです。

WindowsにおけるR言語(RStudio)環境のインストール方法と、
シンプルな使い方の紹介です。

まず、R言語のインストール。
以下からパッケージを取得します。
https://cran.rstudio.com/

インストーラを実行します。
基本的には、メッセージ通りに進めていけばOKです。


起動すると、少しレトロチックなRGuiが表示されます。

続いて、RStudioのインストール。
https://rstudio.com/
https://rstudio.com/products/rstudio/

こちらもダウンロードしたインストーラを実行し、メッセージ通り進めていきます。


起動すると、クラッシュレポート送信に関するメッセージが出力されます。
一度設定しても、グローバルオプションから無効化できます。

初期画面では、Console・Enviroment・Filesのペインが表示されています。

Consoleペインにあるメッセージに従って demo()を実行すると
デモの使い方を教えてくれます。

インストール済みの機能(パッケージ)は、Packagesペインで確認できます。
ここでは、パッケージの追加や更新もできます。

四則演算

> 1 + 1
[1] 2
> 1-1
[1] 0
> 2*3
[1] 6
> 4/2
[1] 2
> 4/3
[1] 1.333333
> 1/3
[1] 0.3333333
> 10 %% 3
[1] 1

変数の使用
<- でも -> でも = 、いずれでもOKです。

> x=1
> x
[1] 1
> y <- 2
> y
[1] 2
> 3 -> z
> z
[1] 3
> 
> 3 * z
[1] 9

定義した変数は、Enviromentペインにも表示されます。

Historyペインでは、操作履歴が確認できます。

コメントは、**#**で書きます。

> #コメントの書き方
> 

ベクトルの操作
関数 c()を使います。
数値型・文字列型のどちらかのみで混在はできず、混在した場合 文字列型になります。
もちろんですが、日本語も使えます。

> c(1,3,5,7,11) -> vec_num
> vec_num
[1]  1  3  5  7 11
> vec_char <- c(x,y,z)
> vec_char
[1] 1 2 3
> vec_char2 = c("America","Brazil","Canada")
> vec_char
[1] 1 2 3
> vec_char2
[1] "America" "Brazil"  "Canada" 
> vec_test = c(7,8,"s","t")
> vec_test
[1] "7" "8" "s" "t"
> vec_test2 = c(11,12,x)
> vec_test2
[1] 11 12  1
> vec_test3 = c("太郎","次郎","三郎")
> vec_test3
[1] "太郎" "次郎" "三郎"

続いて、少しデータ分析っぽく。
本日の全国最高気温から4地点をピックアップして、平均値・ラベルを付けて出力。

> temperature = c(40.4,40.0,12.3,11.8)
> average_temperature = mean(temperature)
> print(average_temperature,digits=4)
[1] 26.12
> print(average_temperature,digits=3)
[1] 26.1
> print(average_temperature,digits=2)
[1] 26
> print(average_temperature,digits=1)
[1] 26
> names(temperature) = c("新潟県三条市","新潟県胎内市","北海道上川地方上川郡上川町","北海道上川地方雨竜郡幌加内町")
> temperature
                新潟県三条市                 新潟県胎内市 
                        40.4                         40.0 
  北海道上川地方上川郡上川町 北海道上川地方雨竜郡幌加内町 
                        12.3                         11.8 

行列の作成
matrix関数を使います。
また、列数(ncol)や行数(nrow)を指定して行列の縦横を決定します。

> mat_num = matrix(
+ data = c(1,2,3,4,5,6,7,8,9),
+ ncol = 3
+ )
> mat_num
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
> mat_num2 = matrix(
+ data = c("a","b","c","d","e","f","g","h","i"),
+ nrow = 3
+ )
> mat_num2
     [,1] [,2] [,3]
[1,] "a"  "d"  "g" 
[2,] "b"  "e"  "h" 
[3,] "c"  "f"  "i" 

colnames関数とrownames関数を使って、行列のラベルを付与できます。

> colnames(mat_num) = c("列1","列2","列3")
> rownames(mat_num) = c("行1","行2","行3")
> mat_num
    列1231   1   4   72   2   5   83   3   6

行列から指定範囲のみ出力したい場合、[行番号,列番号] で指定します。
: で範囲指定も可能です。

> mat_num[1,]123 
  1   4   7 
> mat_num[1:2,]1231   1   4   72   2   5   8
> mat_num[1,1]
[1] 1
> mat_num[1:2,1:2]121   1   42   2   5

R言語 & RStudio、なかなか面白いですね。
ちょっと使ってみるだけでも、データ分析向け(尖っている?)というのを感じることが出来ました。
非プログラマですが、使いやすかったのみ印象的でした!

Discussion