📊

【初心者向け】RとRStudioのダウンロード・インストール 2021年9月版

6 min read

概要

この記事では、データ分析に特化したプログラミング言語であるRとR言語のIDEであるRStudioのダウンロードとインストールの手順を紹介します。

また、Rを使ったデータ分析で良く利用されるtidyverseなどのパッケージのインストールとRStudioでLatexを使いPDFを出力するための準備まで紹介します。

またこの記事では以下のことは扱いません。

  • R言語の解説
  • RStudioの機能の詳細な解説

Rのダウンロードからインストールまで

Rとは?

Rとは統計解析のためのプログラミング言語です。Rが提供するアプリケーションはダウンロード・インストールから実行環境を整えるまでが比較的容易です。アプリケーション開発などの目的を持たず、単純にデータ分析だけに集中したいというケースにおいてはRはとてもおすすめです。

Rのダウンロード

下記のサイトにアクセスし、端末のOS用のインストーラーをダウンロードしましょう。

https://cran.r-project.org/

CRANのトップページ

OSのリンクに飛ぶとダウンロードするバージョンを選択できます。ここでは自分のOSのバージョンに合ったものを選びましょう。各自の端末におけるOSとそのバージョンの確認方法についてはここでは扱いません。

Rのインストール

ダウンロードしたファイルを起動させましょう。基本的には特にオプションを変更する事はせずにインストーラーの指示通りに進めて大丈夫です。

インストールが完了し、アプリケーションに「R」が追加されていれば完了です。Rを起動すると次のような画面が表示されるはずです(画像はMacOS)。

MacOS Catalina 10.15.7の場合

これをコンソール画面と呼んだりします。

Rの動作確認

Rが正常に動作するか確認しましょう。以下のように記述し、Enterを押してください。このとき、>はRのコンソール画面にあらかじめ表示してある文字なので無視してください。入力するのは1 + 1のみです。 注意してください。

1 + 1

すると

> 1 + 1
[1] 2

と表示されるはずです。これで1+1の計算を実行でき、2という結果を得ることができました。動作確認は完了です。

ミラーサイトの設定

Rでは世界中のRユーザーがCRANを通じて配布しているパッケージを利用することができます。CRANのサーバーは世界各地にあるため、どのサーバーからダウンロードするかを指定しておくと良いでしょう。

そのために、以下のようにchooseCRANmirror()関数を実行します。(chooseCRANmirror()と入力し、Enterを押してください。)

chooseCRANmirror()

すると次のようなウィンドウが表示されるはずです。

ミラーサイトの選択画面

日本の方であれば、Japan(Tokyo)[https] を選択しましょう。海外にいる方は最寄りの場所を選択してください。

選択したらOKボタンを押してウィンドウが閉じれば設定は完了です。

パッケージのインストールと読み込み

パッケージを利用するには、Rの関数として提供されている以下の2つを実行すればOKです。

  1. install.packages("{package名}")
  2. library({package名})

特に1のinstall.packagesは最初に1度だけ実行すれば大丈夫ですが。2はRを起動し直すたびに実行する必要があるので注意してください。

※例えばggplotというパッケージを利用するためには{package名}{}も含めてggplotに置き換えてください。

  • e.g) install.packages("ggplot")

※これらはそれぞれpythonでライブラリを使う際のpip install {package名}import {packages名}のようなものです。

RStudioのダウンロードとインストール

ここからはRStudioの準備を進めていきます。

RStudioとは?

RStudioはRを実行するためのオープンソースの統合開発環境(IDE)です。Rをより便利に使うことができます。あくまでプログラムを実行するのはR自身であり、その意味ではRと出来ることは変わりません。しかし分析・開発環境としては圧倒的にRStudioの方が優れています。たとえば、

  • プロジェクト単位での開発
    • 環境管理
    • ソースコード管理
    • Gitの利用
  • Rmarkdownによるドキュメント作成
  • pythonも実行できる

などが挙げられます。

https://www.rstudio.com/products/rstudio/

(一部抜粋)

RStudio is an integrated development environment (IDE) for R. It includes a console, syntax-highlighting editor that supports direct code execution, as well as tools for plotting, history, debugging and workspace management.

RStudio is available in open source and commercial editions and runs on the desktop (Windows, Mac, and Linux) or in a browser connected to RStudio Server or RStudio Workbench (Debian/Ubuntu, Red Hat/CentOS, and SUSE Linux).

上記のページに記載があるように、RStudioはRのためのIDEであり、コンソール画面だけでなく多機能なエディターを提供してくれています(Rもエディターを提供しています)。また作図履歴・プログラムの実行履歴を保持してくれたり、その時環境にあるオブジェクトの内容をクイックに確認したりする機能を備えています。この他にも様々な機能を提供しています。

RStudioのダウンロードとインストール

では、RStudioをダウンロードしましょう。Rの時と同じく各自の端末のOSとそのバージョンに適したものをダウンロードしてください。

こちらのページの下部にインストーラの一覧があるのでここから選びましょう。

https://www.rstudio.com/products/rstudio/download/

The list of RStudio installers

詳細な遷移画面は割愛しますが、RStudioについても基本的にはインストーラーの指示に従って進めてください。

RStudioの起動

RStudioのアプリを起動して次のような画面が表示されることを確認してください。

RStudioの起動後画面

Rとは異なり、paneと呼ばれるウィンドウが3つあることがわかると思います。コンソール画面が左側に、右上には変数やプログラムの実行履歴を確認できる画面が用意されており、右下にはプロットの結果やその時開いているプロジェクトのフォルダのファイルをブラウザできるタブが用意されています。

このpaneの種類や配置は設定から各自で自由に変更することができます。

RStudio > preference > Pane Layout から編集できます。

RStudioの動作確認

念のため動作を確認して見ましょう。次のプログラムを実行してください。

x <- "Hello World"

すると右上のpaneにオブジェクトxの簡単な説明が追加されているはずです。

右上のpane

これで一々xに何が入っているのかをprint(x)して確認する手間が省けます(実際にはprint(x)した方が早いかもしれませんが)。

もう少しこれが強力なUIであることを見ていきましょう。次のプログラムを実行して見てください。

df <- iris

irisとはアヤメに関する有名なデータセットです。Rではデフォルトでデータフレームオブジェクトとしてこのデータセットが提供されています。上記を実行することで右上のpaneに新たにdfが追加されているはずです。このレコードを開くとこのデータフレームの中身を簡単にチェックすることもできます。

データフレームの確認

いくつかのパッケージのインストール

よく使う・便利なパッケージの簡単な紹介

最後に、実際にいくつかのパッケージをインストールして見ましょう。ここでは私の偏見でよく使うパッケージを紹介しますが、もし「これもよく使うでしょ!」と言うものがあれば是非コメントください。

各パッケージの詳細な説明は割愛します。簡単な紹介に留めます。

  • tidyverse:データ分析をより便利に行えるパッケージ群
  • plotly:インタラクティブ・リッチなプロットを作成できるパッケージ
  • rmarkdown:HTMLはPDFなどのドキュメントを生成できるパッケージ
  • mlr3:機械学習全般を扱えるパッケージ

インストール

上記のパッケージをインストールしましょう。install.packagesでは複数のパッケージを一度にインストールすることができます。

pkgs <- c("tidyverse", "plotly", "rmarkdown", "mlr3")
install.packages(pkgs)

※全てのインストールを完了するのは数分〜数十分かかる可能性があります。

パッケージの読み込み

既に紹介したように、パッケージはインストールするだけではその提供する機能を呼び出すことはできません。
library({package名})を実行して環境に読み込む必要があります。そしてRまたはRStudioを起動するたびに、各々実行する必要があります。

※実際はプロジェクト単位で.Rprofileファイルを作っておくことで、起動時に指定したパッケージを自動で読み込むようにすることが可能です。

library(tidyverse)
library(plotly)
library(rmarkdown)
library(mlr3)

エラーなく読み込めれば完了です。

読み込んだ際に以下のような警告が出る場合があります。

以下のオブジェクトは ‘package:dplyr’ からマスクされています
	hogehoge, fugafuga, ...

これは、いくつかのパッケージで共通の関数名が使われている場合に表示されます。利用の際はpackage-name::function-nameのようにどのパッケージの関数であるかを明記した記法を採用するように注意してください。

※私はdplyr::filterをよく使います。

最後に

本記事では、初心者の方のためにRとRStudioのダウンロードからインストールまでを紹介しました。また、パッケージのインストールから読み込みまでの流れも簡単に紹介しました。

わかりにくい点や間違いがありましたらご指摘いただけると幸いです。

Discussion

ログインするとコメントできます