連載
» 2015年03月04日 10時00分 公開

わら山から「わら」を探す人工知能、「プレディクティブコーディング」とは?5分で分かる最新キーワード解説(1/3 ページ)

不正行為の証拠発見を人間の数千倍のスピードで実行できる人工知能が登場した。訴訟大国の米国でビジネスを行う際には要チェックだ。

[土肥正弘,ドキュメント工房]

 今回のテーマは「プレディクティブコーディング」だ。訴訟大国、米国の「ディスカバリ」制度での効果が認められて導入が進む本技術は、情報の自動分類や不正行為の証拠発見を時には人間の数千倍のスピードで実行できる仕組みだ。一体どのようなものだろうか。

「プレディクティブコーディング」とは

 プレディクティブコーディングは、膨大な文書やデータから目的に沿ったものを選び出す、人工知能技術を利用した新しい仕分け技術だ。

 米国での訴訟の際、法廷での事実審理(トライアル)の前に行う証拠開示(ディスカバリ)プロセスで証拠となるデータを期限内に過不足なくそろえて提出する作業負荷を軽減、効率化するために開発された技術で、弁護士があらかじめ選んだ少量のデータをコンピュータが学習し、大量のデータを分析する。

 ディスカバリ支援企業は米国に約1200社あるといわれるが、プレディクティブコーディング技術を開発し、提供する企業は世界でも数社にすぎない。日本ではUBICが独自開発プラットフォーム(Lit i View、リット・アイ・ビュー)の機能として「Predictive Coding」を搭載し、企業向けに提供するのが現在のところ唯一だ。

 今回は、UBICの技術をベースにプレディクティブコーディングのあらましを紹介していこう(以下、本文中の仕組みや効果などの具体例はUBICの事例、実績に基づく)。

「プレディクティブコーディング」が生まれた背景は?

 米国は訴訟大国と呼ばれるほど訴訟が多いのはご存じの通り。しかし、法廷に持ち込まれるケースはそのうち3%程度といわれ、大半はその前の協議で和解する。和解率が高い理由の1つが、裁判前にお互いが求められた証拠に関する文書やデータを全て開示するディスカバリ手続きだ。

 日本にはない本制度は、米国が訴訟しやすい環境であること、当事者同士が事前に情報や争点を整理して対等に証拠を提示して話し合うことなど、同国ならではの「当事者主義」に根ざしている。

 ディスカバリでは審理準備のための証言録取、書面による質問回答に加え、訴訟に関係する文書やデータの開示、提出が求められる。もちろん米国に進出する日本企業も例外ではなく、求められたら日本側に保管されている関連資料(日本語のものも含め)も提出しなければならない。

 2006年には文書開示の範囲が電子化情報にまで拡張(eディスカバリ法)され、今では事前準備の労力とコストの大半を占めるまでになった。電子化情報であれ、紙の文書であれ、期日までに請求された資料を提出できないと、裁判はもちろん和解協議でも不利な立場に追い込まれる可能性がある。

 事前準備にかかるコストと時間が大問題だ。訴訟が起こされたら短期間に必要な文書やデータを収集し、その中から訴訟内容に関連するものを弁護士がレビューして選別する必要がある。しかし、PCおよびメールサーバやファイルサーバなどに保管されたデータを合わせるとTBレベル以上に上るだろう。

 PCの20GBのデータでさえ、プリントアウトして積み上げると100階建てビルの高さに及ぶといわれ、膨大な文書やデータを閲覧、レビューするために、これまでは少なくとも数人、多ければ数百人以上の弁護士が数カ月から数年にわたって取り組む必要があった。その労力とコストおよび時間をできるだけ削減しようというのが、プレディクティブコーディングのそもそもの目的だ。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。