目次
このチュートリアルでは、R AnalyticFlowによるデータ分析について学びます。 本節ではR AnalyticFlowにおける基本概念について学び、 次節では実際にサンプルデータを分析しながらソフトウェアの操作を学びます。
R AnalyticFlowでは、分析フローを記述することでデータ分析を行います。 例として、以下の短いRスクリプトで示される分析をフローとして表してみましょう:
data(iris) plot(iris[, 1:4], col = as.integer(iris$Species) + 1) boxplot(Petal.Length ~ Species, data = iris, col = 3, main = "Petal.Length")
このスクリプトの詳細については、ひとまず気にする必要はありません。 要約すると、このスクリプトは以下の処理を順番に行います:
データを読み込む
データの散布図を描く
箱ひげ図を描く
分析フローはこのような「処理の流れ」を図として表したものです。 この例の場合は以下のような図で表現されます:
処理を表す図形(ディスクのマークや三角形)をノード、 ノードを繋ぐ矢印をエッジと呼びます。 エッジが示す順序に沿ってさまざまな処理が行われます。
R AnalyticFlowでは、このような分析フローを描き、フローに従って処理を実行することで分析を行います。 分析フローによってデータ分析のプロセスを容易に概観することができ、 分析そのものはもちろん、ナレッジの共有を円滑に行うことができるようになります。