ここまでの内容で、R AnalyticFlowの基本的な利用方法を身に付けることができました。 さまざまな分析でフローを作成し、活用することができます。
R AnalyticFlowには本チュートリアルでカバーできなかった様々な機能があります。 これらの内容については、以下の情報ソースから習得することができます。
R AnalyticFlowのさまざまな機能について学ぶことができる
学習用サンプルファイルが利用できます。
サンプルは標準の作業ディレクトリの 「Tutorial
」ディレクトリ以下、
またはインストールディレクトリの「sample/Tutorial
」ディレクトリ以下にあります。
いくつかのノードには機能を説明するコメントが設定されています。 ノードの上でマウスを静止させるとコメントが表示されます。
このフローでは、ボックス機能について学ぶことができます。 ボックスは部分フロー(フローの一部)を格納することができる特殊なノードです。 ボックス機能を活用することで、複雑なフローをシンプルにまとめることが可能です。
参考として以下の分析サンプルが利用できます。
サンプルは標準の作業ディレクトリの 「SampleAnalysis
」ディレクトリ以下、
またはインストールディレクトリの「sample/SampleAnalysis
」ディレクトリ以下にあります。
本チュートリアルで行った iris データの分析です。 チュートリアルではたった3行の短い分析でしたが、 この分析サンプルではアヤメの品種を予測する決定木モデルを作成し、 予測誤差の検証を行っています。
同じ分析を行うRスクリプトは、サンプルディレクトリ以下の「script
」に
「IrisAnalysis.R
」として保存されています。
ボストンの住宅価格データ(Harrison and Rubinfeld (1978))による分析例です。
データマイニングのフレームワークを意識した、より実践的な分析例です。 このフローでは以下のような分析を行っています:
データの探索的分析
変数の変換
データを学習用と検証用に分割
予測モデルの学習と検証
予測結果をデータファイルへ書き出し
この分析は、本チュートリアルでは説明できなかった 「自由記述ノード」の利用(「変数変換」ノードを参照)、 データの書き出し、ノードのコメント (「サンプリング」ノード上でマウスを静止させると表示)などを含んでいます。