統計解析ソフト「R」を試してみた
たまに名前を聞いて気になっていた統計解析ソフトの「R」(R言語)。最近はデータ解析といえばPythonが主流ですが、その前はフリーのデータ分析ソフトとては「R」がほぼ一強だったそうです。歴史がある分、ライブラリも豊富なのでうまくPythonと使い分ければデータ分析の効率が上がりそうですね。PythonとRの連携とかもできるそうですので、うまく組み合わせられればいいとこ取りもできそうです。
というわけで、今回はセットアップから簡単な使い方の紹介までをしてみたいと思います。
「R」のインストール
セットアップに関しては、Mac前提です。Windowsの方は各自調べてみて下さい。Windowsの方が簡単だと思います(多分)。
Homebrewで、以下コマンド一発でインストールできます。
$ brew install r
「R」のIDE環境である「R Studio」はHomebrew caskでインストールできます。以下コマンドでOKです。
$ brew cask install rstudio
HomebrewやHomebrew caskに関しては、以下記事参照ください。
起動すると以下のような画面が出てきます。
Rの基礎練習
まずはデータをインプットしてプロットします。例えば、以下のように入力しましょう。
> x1 <- rnorm(1000, 0, 1) > plot(x1, type="l", col="blue")
1行目でデータ数1000の正規乱数を生成して、2行目で線タイプがライン、色が青のグラフをプロットしています。実行すると、以下のように表示されます。
なお、ここで右下のパネルを小さくしていると、以下のエラーが出ます。
plot.new() でエラー: figure margins too large
右下のパネルを大きくするか、以下で新しいウィンドウを開きましょう。
> dev.new() NULL > plot(x1, type="l", col="blue")
以下最初の >
は省略します。そのままコピー&ペースとすれば動くと思います。
例えば以下のような式のグラフを書く場合の例です。
Rでは以下のようにかきます。
x2 <- 0 for (t in 2:1000){ x2[t] <- x2[t-1] + 1 } plot(x2, type="l", col="red")
以下のようなグラフとなります。
以下のような式だと
Rでは以下となります。
x3 <- 1 for (t in 2:100){ x3[t] <- 2*x3[t-1] } plot(x3, type="l", col="red")
グラフは以下ですね。
まとめ
Rをセットアップしてちょっとだけ触ってみました。ツールは大いに越したことはないですが、あんまり増やしても使い方思い出すのに大変になってくるので悩ましいですね。はてなブログだと、かの有名なid:TJOさんがRを使った分析記事を書いているので、参考にして試してみると面白そうです。
あと id:niszet さんも、「R」に関して多く情報発信をしているので「R」に興味がある方は要チェックですね。