【初心者向け】RとRStudioのダウンロード・インストール 2023年10月版
概要
この記事では、データ分析に特化したプログラミング言語であるRとR言語のIDEであるRStudioのダウンロードとインストールの手順を紹介します。
また、Rを使ったデータ分析で良く利用されるtidyverse
などのパッケージのインストールとRStudioでLatexを使いPDFを出力するための準備まで紹介します。
またこの記事では以下のことは扱いません。
- R言語の解説
- RStudioの機能の詳細な解説
Rのダウンロードからインストールまで
Rとは?
Rとは統計解析のためのプログラミング言語です。Rが提供するアプリケーションはダウンロード・インストールから実行環境を整えるまでが比較的容易です。アプリケーション開発などの目的を持たず、単純にデータ分析だけに集中したいというケースにおいてはRはとてもおすすめです。
Rのダウンロード
下記のサイトにアクセスし、端末のOS用のインストーラーをダウンロードしましょう。
OSのリンクに飛ぶとダウンロードするバージョンを選択できます。ここでは自分のOSのバージョンに合ったものを選びましょう。各自の端末におけるOSとそのバージョンの確認方法についてはここでは扱いません。
Rのインストール
ダウンロードしたファイルを起動させましょう。基本的には特にオプションを変更する事はせずにインストーラーの指示通りに進めて大丈夫です。
インストールが完了し、アプリケーションに「R」が追加されていれば完了です。Rを起動すると次のような画面が表示されるはずです(画像はMacOS)。
これをコンソール画面と呼んだりします。
Rの動作確認
Rが正常に動作するか確認しましょう。以下のように記述し、Enterを押してください。このとき、>
はRのコンソール画面にあらかじめ表示してある文字なので無視してください。入力するのは1 + 1
のみです。 注意してください。
1 + 1
すると
> 1 + 1
[1] 2
と表示されるはずです。これで1+1
の計算を実行でき、2
という結果を得ることができました。動作確認は完了です。
ミラーサイトの設定
Rでは世界中のRユーザーがCRANを通じて配布しているパッケージを利用することができます。CRANのサーバーは世界各地にあるため、どのサーバーからダウンロードするかを指定しておくと良いでしょう。
そのために、以下のようにchooseCRANmirror()
関数を実行します。(chooseCRANmirror()と入力し、Enterを押してください。)
chooseCRANmirror()
すると次のようなウィンドウが表示されるはずです。
日本の方であれば、Japan(Tokyo)[https] を選択しましょう。海外にいる方は最寄りの場所を選択してください。
選択したらOKボタンを押してウィンドウが閉じれば設定は完了です。
パッケージのインストールと読み込み
パッケージを利用するには、Rの関数として提供されている以下の2つを実行すればOKです。
install.packages("{package名}")
library({package名})
特に1のinstall.packages
は最初に1度だけ実行すれば大丈夫ですが。2はRを起動し直すたびに実行する必要があるので注意してください。
※例えばggplot
というパッケージを利用するためには{package名}
を{}
も含めてggplot
に置き換えてください。
- e.g)
install.packages("ggplot")
※これらはそれぞれpython
でライブラリを使う際のpip install {package名}
とimport {packages名}
のようなものです。
RStudioのダウンロードとインストール
ここからはRStudioの準備を進めていきます。
RStudioとは?
RStudioはRを実行するためのオープンソースの統合開発環境(IDE)です。Rをより便利に使うことができます。あくまでプログラムを実行するのはR自身であり、その意味ではRと出来ることは変わりません。しかし分析・開発環境としては圧倒的にRStudioの方が優れています。たとえば、
- プロジェクト単位での開発
- 環境管理
- ソースコード管理
- Gitの利用
- Rmarkdownによるドキュメント作成
- pythonも実行できる
などが挙げられます。
(一部抜粋)
RStudio is an integrated development environment (IDE) for R. It includes a console, syntax-highlighting editor that supports direct code execution, as well as tools for plotting, history, debugging and workspace management.
RStudio is available in open source and commercial editions and runs on the desktop (Windows, Mac, and Linux) or in a browser connected to RStudio Server or RStudio Workbench (Debian/Ubuntu, Red Hat/CentOS, and SUSE Linux).
上記のページに記載があるように、RStudioはRのためのIDEであり、コンソール画面だけでなく多機能なエディターを提供してくれています(Rもエディターを提供しています)。また作図履歴・プログラムの実行履歴を保持してくれたり、その時環境にあるオブジェクトの内容をクイックに確認したりする機能を備えています。この他にも様々な機能を提供しています。
RStudioのダウンロードとインストール
では、RStudioをダウンロードしましょう。Rの時と同じく各自の端末のOSとそのバージョンに適したものをダウンロードしてください。
こちらのページの下部にインストーラの一覧があるのでここから選びましょう。
詳細な遷移画面は割愛しますが、RStudioについても基本的にはインストーラーの指示に従って進めてください。
RStudioの起動
RStudioのアプリを起動して次のような画面が表示されることを確認してください。
Rとは異なり、paneと呼ばれるウィンドウが3つあることがわかると思います。コンソール画面が左側に、右上には変数やプログラムの実行履歴を確認できる画面が用意されており、右下にはプロットの結果やその時開いているプロジェクトのフォルダのファイルをブラウザできるタブが用意されています。
このpaneの種類や配置は設定から各自で自由に変更することができます。
※ RStudio > preference > Pane Layout
から編集できます。
RStudioの動作確認
念のため動作を確認して見ましょう。次のプログラムを実行してください。
x <- "Hello World"
すると右上のpaneにオブジェクトx
の簡単な説明が追加されているはずです。
これで一々x
に何が入っているのかをprint(x)
して確認する手間が省けます(実際にはprint(x)
した方が早いかもしれませんが)。
もう少しこれが強力なUIであることを見ていきましょう。次のプログラムを実行して見てください。
df <- iris
iris
とはアヤメに関する有名なデータセットです。Rではデフォルトでデータフレームオブジェクトとしてこのデータセットが提供されています。上記を実行することで右上のpaneに新たにdf
が追加されているはずです。このレコードを開くとこのデータフレームの中身を簡単にチェックすることもできます。
いくつかのパッケージのインストール
よく使う・便利なパッケージの簡単な紹介
最後に、実際にいくつかのパッケージをインストールして見ましょう。ここでは私の偏見でよく使うパッケージを紹介しますが、もし「これもよく使うでしょ!」と言うものがあれば是非コメントください。
各パッケージの詳細な説明は割愛します。簡単な紹介に留めます。
-
tidyverse
:データ分析をより便利に行えるパッケージ群 -
plotly
:インタラクティブ・リッチなプロットを作成できるパッケージ -
rmarkdown
:HTMLはPDFなどのドキュメントを生成できるパッケージ -
mlr3
:機械学習全般を扱えるパッケージ
インストール
上記のパッケージをインストールしましょう。install.packages
では複数のパッケージを一度にインストールすることができます。
pkgs <- c("tidyverse", "plotly", "rmarkdown", "mlr3")
install.packages(pkgs)
※全てのインストールを完了するのは数分〜数十分かかる可能性があります。
パッケージの読み込み
既に紹介したように、パッケージはインストールするだけではその提供する機能を呼び出すことはできません。
library({package名})
を実行して環境に読み込む必要があります。そしてRまたはRStudioを起動するたびに、各々実行する必要があります。
※実際はプロジェクト単位で.Rprofile
ファイルを作っておくことで、起動時に指定したパッケージを自動で読み込むようにすることが可能です。
library(tidyverse)
library(plotly)
library(rmarkdown)
library(mlr3)
エラーなく読み込めれば完了です。
読み込んだ際に以下のような警告が出る場合があります。
以下のオブジェクトは ‘package:dplyr’ からマスクされています
hogehoge, fugafuga, ...
これは、いくつかのパッケージで共通の関数名が使われている場合に表示されます。利用の際はpackage-name::function-name
のようにどのパッケージの関数であるかを明記した記法を採用するように注意してください。
※私はdplyr::filter
をよく使います。
最後に
本記事では、初心者の方のためにRとRStudioのダウンロードからインストールまでを紹介しました。また、パッケージのインストールから読み込みまでの流れも簡単に紹介しました。
わかりにくい点や間違いがありましたらご指摘いただけると幸いです。
Discussion