「dotData」は、目的を設定し分析を開始してから結果が出るまで、数カ月もの期間がかかる従来のデータサイエンスプロセスを自動化し、たった数日でデータ分析の結果にたどり着くことができる、データ分析ソフトウェアです。
データ分析ソフトウェア「dotData」とは
データ分析のプロセスを自動化
データ分析ソフトウェア「dotData」は、データ分析のプロセスを自動化します。試行錯誤に費やす時間・労力を削減できるため、よりビジネス施策の検討に注力できます。
NECのデータ分析ツール「dotData」について
分析工数の8割を占めるデータ前処理「特徴量設計」を自動化
従来のデータサイエンスプロセスでは、目的を設定し分析を開始してから結果が出るまで、数カ月もの期間がかかっていました。特に難しいとされる「特徴量設計」を含むデータの前処理だけで、分析工数の実に8割を占めるとも言われています。「dotData」は、このプロセスを自動化するため、たった数日でデータ分析の結果にたどり着くことができ、ビジネス課題への適用・戦略策定がよりスピーディーに行えるようになります。
「dotData」が実現する特徴量設計について
従来、複数の表に散らばったデータを手動で加工し、特徴量を作成。膨大な試行錯誤を繰り返す必要があり、分析に時間がかかっていました。「dotData」は複数の表を自動で整理・集約、特徴量を自動探索し、生成関数を自動で生成。特徴量設計工程の大半を自動化することができます。
特徴量設計とは
特徴量設計とは、データベースから予測に役立つ変数(特徴量)の表(サンプル×特徴)を作成する作業です。分析工数の8割を占めるといわれるデータ前処理のうち、特に難易度が高く、専門家による試行錯誤が必要な作業になります。特徴量は属性や事象など、目的につながる特徴を抽出して導き出します。例えば、野球観戦でのフライドポテトの売上予測を行う際、「野球場でビールを買う男性」「気温が28℃以下で天候は曇り」「6カ月以内に結婚した郊外在住の30代女性」など、抽出したデータが特徴量になります。
特徴量設計は、専門家による試行錯誤が不可欠
フロー項目 | 項目内容 |
---|---|
特徴量から仮説作成 | 可能性のある特徴量から仮説を立案。特徴量は無限にあるため、専門家による経験と勘に依存する項目。 |
特徴量生成クエリの実装 | 数百から数千の特徴量を手作業で実装する項目。バグの混入による手戻りや、システム化によるテスト工数が大きい項目。 |
特徴量の生成 | 工事台帳、仕入れ帳、工事別出面集計表 |
モデル設計(機械学習) | 膨大な量のデータを機械に学習させ、そのデータ内の傾向を取得する項目 |
評価 | 試算表、総勘定元帳、請求書 |
「dotData」は特徴量設計工程の大半を自動化
線形回帰、決定木など、複数のアルゴリズムを利用し、数多くの予測モデルを自動で設計。データに最適な組み合わせで高精度な予測モデルを作成します。「dotData」は結果の根拠を示し、最適なアルゴリズムを推奨してくれます。予測結果だけでなく、結果の根拠が示されることにより、その理由を理解することができ、判断や計画における意思決定につなげることができます。
大塚商会では、「dotData」をお手軽でリーズナブルに活用いただけます
大塚商会が保有する「dotData」実行環境を利用し、お客様に最先端AIの活用機会をお手軽、リーズナブルにご提供します。分析、予測の作業は大塚商会のデータサイエンティストが実施、お客様はAIツールの導入コストを負担することなくデータをご用意いただくだけで、AI分析結果を得ることが可能です。
ユースケース
「dotData」が提供する予測分析は、アクションを取るべき対象を抽出する「ターゲティング」、見えない値を予測する「回帰」、対象をカテゴリーへ分類する「判別」など、さまざまなユースケースに対応可能です。ターゲティングでは、解約候補や新規会員候補予測をはじめ、店舗商品・サービスの推薦、サービスDMターゲット予測を行うことができます。回帰では、商品需給予測や顧客LTV推定など、判別では、人気商品予測や顧客ペルソナ判別などを行うことができます。
ナビゲーションメニュー