【オプション】 R言語の利用

(1) すでに開いている notebook 上でいくつかのサンプルを実行してみましょう。

(2) 今回は元々組み込みで用意されている、iris データセットを用いてみます。これはアヤメの分類データで、Iris 属の3種(setosa, versicolor および virginica)の 50 標本のそれ ぞれについて、がく片 (sepal) と花弁 (petal) のそれぞれの長さと幅、計 4 項目の計測値が集められたものです。

(3) それでは、下記の内容をそれぞれセルに入れて実行していきましょう。# から始まる行はコメントですので、入力しなくても構いません。

# データのロード
data(iris)
# データの確認
str(iris)
# 標準偏差
sd(iris$Sepal.Length)
# 可視化用にライブラリのインストール
install.packages("ggplot2")
# ライブラリパッケージのロード
library(ggplot2)
# 散布図を書く
qplot(data=iris, x=Sepal.Length, y=Sepal.Width, color=Species)
# 回帰直線を追加
qplot(data=iris, x=Sepal.Length, y=Sepal.Width, color=Species) +stat_smooth(method = "lm",fullrange = T, se = T,aes(fill = Species, color=Species),alpha=0.1) 
# 3次元プロットのためにライブラリのロード
library(lattice)
# 3次元プロット
cloud(data = iris, Sepal.Length ~ Petal.Length * Petal.Width,  groups = Species)

次に、plotlyライブラリを使ってみましょう。 今回は組み込みの火山のデータを読み込んで表示してみます。 表示されたグラフをマウスで操作すると視点をインタラクティブに変更できます。

# ライブラリのロード
install.packages("plotly")
library(plotly)
# 火山のサンプルデータの3次元可視化
plot_ly(z = ~volcano) %>% add_surface()

結果のグラフが小さく見づらい場合には、大きく表示したいセルを選択し、その左側にある青色のバーの上で右クリック、「Create New View for Output」をクリックすると新しいタブで結果を表示できます。

ここまででSageMakerでR言語を使うワークショップ終了です。「後片付け」の項目を行ってください。