プレディクティブ・ コーディング

読み方 : ぷれでぃくてぃぶこーでぃんぐ

プレディクティブ・ コーディングとは

企業が管理している大量のメールや文書ファイルに優先順位を付ける技術。米国で訴えられた企業に義務付けられている証拠データの提出で、作業の負担を軽減する技術として期待が高まる。

「特許を侵害された」「製品を使ったら被害が出た」――。米国でこのような民事訴訟を起こされた場合、日本企業は社内にある「証拠」を自ら集め、裁判所に提出することが求められる。米国では裁判になる前、必要な証拠を出し尽くしたうえで、裁判をするのか和解に持ち込むのかを決めるからだ。

被告である企業が提出しなければならない証拠は、紙の文書だけではない。2006年に施行された「eディスカバリー」という法律によって、メールや文書ファイルといった企業が管理している電子データも対象になっている。

背景:訴訟での作業負担高まる

これらの電子データの中から証拠を抽出する技術としてここ数年、プレディクティブ・コーディングという技術に、注目が集まっている。予測符号化と訳されるこの技術は、証拠となる一部のデータを分析し、その結果を受けて、残りのデータから証拠となり得るデータかどうかを機械的に判断するというものだ。

この技術を搭載したソフトやクラウドサービスが判断した結果は、証拠となり得るデータから、証拠となる可能性の低いデータへと優先順位を付けたランキング形式で示される。このためプレディクティブ・ランキングとも呼ばれる。

注目が集まる背景には、企業が管理する電子データが膨大になって、証拠を探す作業が大きな負担になっていることが挙げられる。大企業になると、社内のファイルサーバーや社員のPCなどにあるメールや文書ファイルは合わせて数百万件に上ることも珍しくない。「企業の担当者が手作業で証拠かどうかを1件ずつチェックするやり方だと、1億円といったコストがかかってしまう」と、米国訴訟に詳しい、UBICの守本正宏社長は指摘する。

効果:作業コストを2分の1に

この技術で、証拠となるファイルかどうかの確認作業を効率化できる。企業担当者がランキングの上位のファイルから確認していけば、「時間をかけて調べてみたけれども、結局証拠となるファイルではなかった」というケースが減り、確認時間を短縮できるからだ。

プレディクティブ・コーディングを使った日本企業向けのサービスは、UBICや米カタリスト・レポジトリ・システムズなどが提供している。その導入効果も大きいようだ。カタリストによれば、米国で訴訟を起こされたある日本企業を支援するため、電子データの証拠探しにプレディクティブ・コーディングを適用したところ、「全データの半数以上は確認する必要がなくなり、コストを大幅に削減できた」とカタリストのジョン・トレデニックCEO(最高経営責任者)は言う。

UBICが支援したケースでは、人手では1億円かかるとみられていた作業を、プレディクティブ・コーディングで4000万円に抑えられたとしている。グローバル企業は、法務分野のITとして、その動向を把握しておくべきだろう。

出典:ITpro「今日のキーワード」(C)日経BP社

[2014年 9月30日 公開]

課題解決に役立つ資料集「ITライブラリー」

じっくり検討いただけるよう、多種多様なおすすめ資料を取り揃えています。

大塚商会の法人向け通販サイト(たのめーる)のご紹介