R言語(Rstudio)環境の構築・簡単な関数の使い方
LinuCエヴァンジェリストの鯨井貴博@opensourcetechです。
WindowsにおけるR言語(RStudio)環境のインストール方法と、
シンプルな使い方の紹介です。
まず、R言語のインストール。
以下からパッケージを取得します。
インストーラを実行します。
基本的には、メッセージ通りに進めていけばOKです。
起動すると、少しレトロチックなRGuiが表示されます。
続いて、RStudioのインストール。
こちらもダウンロードしたインストーラを実行し、メッセージ通り進めていきます。
起動すると、クラッシュレポート送信に関するメッセージが出力されます。
一度設定しても、グローバルオプションから無効化できます。
初期画面では、Console・Enviroment・Filesのペインが表示されています。
Consoleペインにあるメッセージに従って demo()を実行すると
デモの使い方を教えてくれます。
インストール済みの機能(パッケージ)は、Packagesペインで確認できます。
ここでは、パッケージの追加や更新もできます。
四則演算
> 1 + 1
[1] 2
> 1-1
[1] 0
> 2*3
[1] 6
> 4/2
[1] 2
> 4/3
[1] 1.333333
> 1/3
[1] 0.3333333
> 10 %% 3
[1] 1
変数の使用
<- でも -> でも = 、いずれでもOKです。
> x=1
> x
[1] 1
> y <- 2
> y
[1] 2
> 3 -> z
> z
[1] 3
>
> 3 * z
[1] 9
定義した変数は、Enviromentペインにも表示されます。
Historyペインでは、操作履歴が確認できます。
コメントは、**#**で書きます。
> #コメントの書き方
>
ベクトルの操作
関数 c()を使います。
数値型・文字列型のどちらかのみで混在はできず、混在した場合 文字列型になります。
もちろんですが、日本語も使えます。
> c(1,3,5,7,11) -> vec_num
> vec_num
[1] 1 3 5 7 11
> vec_char <- c(x,y,z)
> vec_char
[1] 1 2 3
> vec_char2 = c("America","Brazil","Canada")
> vec_char
[1] 1 2 3
> vec_char2
[1] "America" "Brazil" "Canada"
> vec_test = c(7,8,"s","t")
> vec_test
[1] "7" "8" "s" "t"
> vec_test2 = c(11,12,x)
> vec_test2
[1] 11 12 1
> vec_test3 = c("太郎","次郎","三郎")
> vec_test3
[1] "太郎" "次郎" "三郎"
続いて、少しデータ分析っぽく。
本日の全国最高気温から4地点をピックアップして、平均値・ラベルを付けて出力。
> temperature = c(40.4,40.0,12.3,11.8)
> average_temperature = mean(temperature)
> print(average_temperature,digits=4)
[1] 26.12
> print(average_temperature,digits=3)
[1] 26.1
> print(average_temperature,digits=2)
[1] 26
> print(average_temperature,digits=1)
[1] 26
> names(temperature) = c("新潟県三条市","新潟県胎内市","北海道上川地方上川郡上川町","北海道上川地方雨竜郡幌加内町")
> temperature
新潟県三条市 新潟県胎内市
40.4 40.0
北海道上川地方上川郡上川町 北海道上川地方雨竜郡幌加内町
12.3 11.8
行列の作成
matrix関数を使います。
また、列数(ncol)や行数(nrow)を指定して行列の縦横を決定します。
> mat_num = matrix(
+ data = c(1,2,3,4,5,6,7,8,9),
+ ncol = 3
+ )
> mat_num
[,1] [,2] [,3]
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
> mat_num2 = matrix(
+ data = c("a","b","c","d","e","f","g","h","i"),
+ nrow = 3
+ )
> mat_num2
[,1] [,2] [,3]
[1,] "a" "d" "g"
[2,] "b" "e" "h"
[3,] "c" "f" "i"
colnames関数とrownames関数を使って、行列のラベルを付与できます。
> colnames(mat_num) = c("列1","列2","列3")
> rownames(mat_num) = c("行1","行2","行3")
> mat_num
列1 列2 列3
行1 1 4 7
行2 2 5 8
行3 3 6
行列から指定範囲のみ出力したい場合、[行番号,列番号] で指定します。
: で範囲指定も可能です。
> mat_num[1,]
列1 列2 列3
1 4 7
> mat_num[1:2,]
列1 列2 列3
行1 1 4 7
行2 2 5 8
> mat_num[1,1]
[1] 1
> mat_num[1:2,1:2]
列1 列2
行1 1 4
行2 2 5
R言語 & RStudio、なかなか面白いですね。
ちょっと使ってみるだけでも、データ分析向け(尖っている?)というのを感じることが出来ました。
非プログラマですが、使いやすかったのみ印象的でした!
Discussion