ニュース
» 2017年07月27日 10時00分 公開

「あの社員辞めそう」「この顧客は上確度」 文章からあぶり出すAI「KIBIT」 (1/3)

心の「機微」を読み取るという意味で名付けられたKIBITは、少ない教師データで人間の「あやしい」という感覚を学ぶAIだ。営業、コンプライアンス、人事、労務、コールセンターなど企業のあらゆる業務で活躍する。

[溝田萌里,キーマンズネット]

 メールや日報、顧客の口コミ、調査資料など、企業においては日々膨大なテキストデータが積み上がる。「大切なデータだけを確認できたらどれだけ業務が効率するだろう」と誰しも思ったことがあるのではないか。重要度にばらつきがある有象無象のテキストデータの中から必要なデータを抽出する作業は骨が折れる上、従業員が企業の「宝」となり得る情報を見落とす可能性もある。

 そうした問題に対応するためのテキストマイニングという技術を知っているだろうか。自然言語で書かれた大量のテキストデータを分析する手法であり、営業、コンプライアンス、人事、労務、コールセンターなど企業のあらゆる業務で活用が可能だ。

 テキストマイニングをかなえる製品にもいろいろと種類がある。例えば、FRONTEOが提供するツールはテキストマイニングの技術に「KIBIT(キビット)」という同社開発の人工知能を組み合わせた製品だ。人間の心の「機微」を読み取るという意味で名付けられた人工知能KIBITが、少ない教師データから人間の暗黙知を学ぶことでテキストを分析する(図1)。

図1 国産KIBITはどんなAI? 図1 国産KIBITはどんなAI?

心の「機微」を読みとり、人に代わって判断するKIBIT

 FRONTEOによれば、KIBITは「人の4000倍の速度でテキストから文章の意味を読み取り、学習データを基に人の判断や情報の選び方を再現する」という。主な特徴は以下の3つ。1つは「暗黙知」、すなわち人が経験則から「何となく」感覚的に分かっていることを学習できること。2つ目は少ない教師データで済むこと。そして3つ目は、分析結果がシンプルということだ。

 まず、ここでの「暗黙知」については、以下のような例が分かりやすい。図2は、左が通常の宴会へのお誘いメール、右が談合事件の実際の証拠となったメールである。一見して両者とも宴会に誘う文面ではあるが、右のメールでは専門家から見れば「前回から時間もたっていますし」「個室」といった表現がより「あやしさ」を醸し出している。KIBITは、このように専門家が経験で身に付ける感覚を学習した上で、大量のテキストメールを自動で仕分けられるのだ。「なぜかは明確に理由付けられないが怪しいと感じる、という感覚値であっても、KIBITが分析し、結果に基づいて判断できる」とFRONTEOは話す。

図2 左のメールは通常のお誘いメール、右は談合事件の証拠になったメール 図2 左のメールは通常のお誘いメール、右は談合事件の証拠になったメール

数件〜数十件の教師データとノートPCで学習

 2つ目の特徴は、数件から数十件の少ない教師データで学習し、未知のデータを判断できることだ。あらかじめ人間が、ランダムに選んだテキストを必要なデータか、そうでないかを解析軸ごとに「あり」「なし」で振り分ければ、KIBITがこの結果を学習してテキストを重要な順番に仕分けるという仕組みだ(図3)。

図3 選別・学習・分析 KIBITの仕組み 図3 選別・学習・分析 KIBITの仕組み

 どのような技術によって可能となるのか詳しく説明したい。これは、同社が「Landscaping」と呼ぶ独自技術と、同じく同社が行動情報科学と呼ぶ技術に基づいたデータ分析のノウハウによって実現している。

 Landscapingとはテキストの単語ごとに重みを割り振り、抽出したい情報とどれだけ近いか計算する方法だ。学習の段階では、自然文のテキストから形態素解析によって品詞の特定や含まれる単語の抽出を行い、必要な情報に対してそれぞれの単語の関連度を表す「重み」を算出、推論モデルを構築する。評価の段階では、未知の文章を形態素解析した後に各単語の重みを計算し、文書全体でスコアの高い順番に並べる。さらに、KIBITが行った分析に対して、人間が「正解」か「不正解」かというフィードバックを繰り返すことで、KIBITの推論モデルをチューニングし、継続的に精度を高めることもできるとFRONTEOは話す。

 また、データ分析において行動情報科学の知見を利用していることも特徴的だ。FRONTEOによれば行動情報科学とは、人間や組織の行動パターンを考慮した上でデータ分析を行う技術である。同社は、多様なデータ分析を通して蓄積してきた情報から、特定の場面における人や組織の行動パターンを洗い出しているという。個別に構築した推論モデルだけでなく、この行動パターンをあらかじめKIBITに学習させているため、より精度の高い結果を得られるとしている。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。