次のステップ

ここまでの内容で、R AnalyticFlowの基本的な利用方法を身に付けることができました。 さまざまな分析でフローを作成し、活用することができます。

R AnalyticFlowには本チュートリアルでカバーできなかった様々な機能があります。 これらの内容については、以下の情報ソースから習得することができます。

学習用サンプル

R AnalyticFlowのさまざまな機能について学ぶことができる 学習用サンプルファイルが利用できます。 サンプルは標準の作業ディレクトリの 「Tutorial」ディレクトリ以下、 またはインストールディレクトリの「sample/Tutorial」ディレクトリ以下にあります。

いくつかのノードには機能を説明するコメントが設定されています。 ノードの上でマウスを静止させるとコメントが表示されます。

NodeExample_ja.rflow

このフローでは、基本となる二種類のノードとアイコンの関係を学ぶことができます。

BoxExample_ja.rflow

このフローでは、ボックス機能について学ぶことができます。 ボックスは部分フロー(フローの一部)を格納することができる特殊なノードです。 ボックス機能を活用することで、複雑なフローをシンプルにまとめることが可能です。

CacheExample_ja.rflow

このフローでは、キャッシュ機能について学ぶことができます。 ノードにキャッシュが設定されていると、初回の実行時に計算結果を自動的に保存し、 次回以降の実行時には再計算の代わりに保存した結果を呼び出します。 時間のかかる計算でも一度だけ実行すればあとはスムーズに分析を進めることができます。

分析サンプル

参考として以下の分析サンプルが利用できます。 サンプルは標準の作業ディレクトリの 「SampleAnalysis」ディレクトリ以下、 またはインストールディレクトリの「sample/SampleAnalysis」ディレクトリ以下にあります。

IrisAnalysis.rflow

本チュートリアルで行った iris データの分析です。 チュートリアルではたった3行の短い分析でしたが、 この分析サンプルではアヤメの品種を予測する決定木モデルを作成し、 予測誤差の検証を行っています。

同じ分析を行うRスクリプトは、サンプルディレクトリ以下の「script」に 「IrisAnalysis.R」として保存されています。

BostonAnalysis_ja.rflow

ボストンの住宅価格データ(Harrison and Rubinfeld (1978))による分析例です。

データマイニングのフレームワークを意識した、より実践的な分析例です。 このフローでは以下のような分析を行っています:

  • データの探索的分析

  • 変数の変換

  • データを学習用と検証用に分割

  • 予測モデルの学習と検証

  • 予測結果をデータファイルへ書き出し

この分析は、本チュートリアルでは説明できなかった 「自由記述ノード」の利用(「変数変換」ノードを参照)、 データの書き出し、ノードのコメント (「サンプリング」ノード上でマウスを静止させると表示)などを含んでいます。