ITとビジネスの専門家によるコラム。経営、業種・業界、さまざまな切り口で、現場に生きる情報をお届けします。
製品、サービスに関するご質問がございましたら、お気軽にお問い合わせください。
簡単で高機能な機械学習プラットフォーム
RapidMiner おすすめ機能
データ加工、データ可視化、モデル作成、評価、運用まで一つのプラットフォームで機械学習に必要な機能を網羅しています。
「RapidMiner」のおすすめ機能一覧
さまざまな種類のデータへアクセスが可能
ファイル、データベース等、さまざまなデータ形式をRead / Writeできます。もちろんPMMLでの出力も可能です。画像はCSVファイルの読み込み設定画面です。
読込可能なデータ形式
- ファイル形式:CSV、Excel、XML、ARFF / XRFF (Weka)、 DBF (dBASE)、SAV (SPSS)、SAS、 DTA (Stata)
- データベース:MySQL、PostgreSQL、Oracle、Microsoft SQL Server、Cassandra、MongoDB
- クラウド接続:Dropbox、Amazon S3、Salesforce、Twitter
- その他:Apache Solr、Splunk、Mozenda
説明変数の準備がとても楽になるデータ加工機能
表の結合、行列入れ替え、サンプリングといった基本的なデータ加工機能はもちろん、ダミー変数化や、複数列同士の直積、ビニングといった説明変数の準備ならではの機能が豊富にあります。画像はテーブルを結合する操作イメージです。
IoTセンサーデータの分析等で特に役立つ充実した時系列分析機能
時系列分析でよく使用される移動平均や差分はもちろん、高速フーリエ変換、ARIMAモデル、自己相関など高度な機能が標準で実装されています。画像はフーリエ変換を実行した結果をグラフにした画面です。
豊富な分析アルゴリズム
クラス分類や回帰分析、クラスター分析、アソシエーション分析等の豊富な機械学習アルゴリズムを搭載しています。画像は決定木アルゴリズムのグラフ表示です。
データ可視化
ヒストグラム、散布図、箱ひげ図などデータ分析でよく使用されるグラフを中心に豊富な可視化機能が用意されています。画像は選択可能なグラフの種類のサンプルです。
モデルの評価・検証機能を網羅的に用意
モデルを評価するときにデータサイエンティストが好んで使用する指標やグラフが網羅的に用意されています。画像は複数のアルゴリズムの性能をROC曲線で比較して評価するグラフです。
交差検証、分割検証でモデルの精度を確認
- さまざまなパフォーマンス指標:
正答率(Accuracy)、適合率(Precision)、 再現率(Recall)、RMSE、AUC、有意差検定など - パラメーターの最適化:Grid(グリッドサーチ)、 Evolutionaryなど