ニュース
» 2021年07月14日 07時00分 公開

AIモデルをブラックボックス化しない「バイラテラルAI」とは?

ディープラーニングで学習したAIモデルは、「なぜそのような出力結果になるのか」が説明できないのが弱点だ。それに対して、人間と機械(AI)が対話を繰り返しながら機械制御に役立つモデルを導き出し、出力結果を明確に説明可能にするのが「バイラテラルAI」だ。いったいどんな仕組みで、何に役立つのだろうか?

[土肥正弘,ドキュメント工房]

「バイラテラルAI」とは?

 「AI(人工知能)は結果を出力するまでのプロセスを説明できない」とよく言われる。画像の自動認識をはじめとしたAI活用は広く進んでいるが、使用されるAIモデルは、ビッグデータからディープラーニングのような機械学習を通して作り上げられるため、モデルを使った処理結果が十分満足できる精度であっても、その精度がどういうプロセスで実現できたのかはブラックボックスとなり、説明することが非常に困難だ。

 そのため、精密な動作制御が要求されるロボット(アクチュエータ)制御に適用するには不安がある。例えば医療や介護に利用する機器が、1%でも稼働条件(温度や湿度、風、各種摩擦抵抗などの外乱)の変化によって動作不安定になると、人命にかかわるような事故につながってしまう可能性があるからだ。

 その懸念を解消するには、精密、繊細なロボット制御に利用するAIは、モデル作成プロセスの全ての物理的意味を説明でき、多少の稼働条件の変化(外乱)があっても100%正しく動作することが保証できるものが望ましい。これにはモデル生成過程がブラックボックスになる機械学習の手法が応用しにくい。

 そこで、コンピュータの大規模、高速演算能力と、人間の知識と経験、技能を組み合わせ、双方が協働する形で、物理的意味が明確な機械制御のためのAIモデルを効果的に、また容易に作成する方法が考えられた。それが「バイラテラルAI」だ。

 これを発想したのは、人間の動作をロボットで再現する研究を長年続けている、慶應義塾大学理工学部教授の桂誠一郎氏だ。バイラテラルAIの仕組みの説明の前に、この技術のベースであり、同氏が8年前に開発した「モーションコピー」について紹介しよう。

バイラテラルAI開発のベースとなった「モーションコピー」

 人間が行う丁寧な手作業は、五感を駆使して微細なフィードバック制御を行いながら正確に位置を決め、運動方向や速度、力を適正に加減して行われる。

 例えば書道の達人は、筆や紙、墨が多少変わろうと、ほぼ同じように文字を書くことができる。人間の触覚や力覚には双方向性があり、どのような場合にどう腕や指を動かせば求めている結果が得られるのかは、熟練者なら意識することなく瞬時に判断できる。しかし、ロボットに同じような判断や動作を自律的に行ってもらうことはとても難しい。文字を1文字書くにも膨大な量の位置情報や速度情報、力の情報が必要で、筆や紙などの微妙な違いを感知して適切に制御しなければならないからだ。

 そのような人間ならではの触覚や力覚を含む動作を機械で再現する研究の一つが「モーションコピー」だ。技術の実証のために、人間が筆で文字を書く動作を、腕に付けたアクチュエータのセンサーで感知し、記録、保存して、ロボットアームで再現する実験が行われた。

図1 書道の熟達者の筆使いをアクチュエータで再現したデモ(出典:慶應義塾大学の資料)

 武田双雲氏や紫舟氏、金澤翔子氏の書をアクチュエータで忠実に再現する実験も行ったところ、文字の形をなぞるばかりでなく、力の込め方や運筆の勢いなど達人の動作をほぼ完全に再現することに成功した。実際には、最初の動作情報記録時とアクチュエータの動作時には紙質や筆、墨の粘度などは異なってくるが、それでもうまく再現できるのは、人間が筆で文字を書く時の反力や動作に影響する外部条件(外乱)を双方向的に感知して、アクチュエータの動作速度や力を微細にコントロールしているからだ。

 この双方向性を取り入れて、広くロボットなどの機械制御に役立つAIを開発しようと取り組んだ技術が「バイラテラルAI」として実を結んだ。

バイラテラルAIの仕組みは?

 「バイラテラルAI」のAIモデルは、次のようなプロセスで作成される(図2)。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

ホワイトペーパーや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。