AIモデルをブラックボックス化しない「バイラテラルAI」とは？

ディープラーニングで学習したAIモデルは、「なぜそのような出力結果になるのか」が説明できないのが弱点だ。それに対して、人間と機械（AI）が対話を繰り返しながら機械制御に役立つモデルを導き出し、出力結果を明確に説明可能にするのが「バイラテラルAI」だ。いったいどんな仕組みで、何に役立つのだろうか？

» 2021年07月14日 07時00分公開

[土肥正弘，ドキュメント工房]

「バイラテラルAI」とは？

　「AI（人工知能）は結果を出力するまでのプロセスを説明できない」とよく言われる。画像の自動認識をはじめとしたAI活用は広く進んでいるが、使用されるAIモデルは、ビッグデータからディープラーニングのような機械学習を通して作り上げられるため、モデルを使った処理結果が十分満足できる精度であっても、その精度がどういうプロセスで実現できたのかはブラックボックスとなり、説明することが非常に困難だ。

　そのため、精密な動作制御が要求されるロボット（アクチュエータ）制御に適用するには不安がある。例えば医療や介護に利用する機器が、1％でも稼働条件（温度や湿度、風、各種摩擦抵抗などの外乱）の変化によって動作不安定になると、人命にかかわるような事故につながってしまう可能性があるからだ。

　その懸念を解消するには、精密、繊細なロボット制御に利用するAIは、モデル作成プロセスの全ての物理的意味を説明でき、多少の稼働条件の変化（外乱）があっても100％正しく動作することが保証できるものが望ましい。これにはモデル生成過程がブラックボックスになる機械学習の手法が応用しにくい。

　そこで、コンピュータの大規模、高速演算能力と、人間の知識と経験、技能を組み合わせ、双方が協働する形で、物理的意味が明確な機械制御のためのAIモデルを効果的に、また容易に作成する方法が考えられた。それが「バイラテラルAI」だ。

　これを発想したのは、人間の動作をロボットで再現する研究を長年続けている、慶應義塾大学理工学部教授の桂誠一郎氏だ。バイラテラルAIの仕組みの説明の前に、この技術のベースであり、同氏が8年前に開発した「モーションコピー」について紹介しよう。

バイラテラルAI開発のベースとなった「モーションコピー」

　人間が行う丁寧な手作業は、五感を駆使して微細なフィードバック制御を行いながら正確に位置を決め、運動方向や速度、力を適正に加減して行われる。

　例えば書道の達人は、筆や紙、墨が多少変わろうと、ほぼ同じように文字を書くことができる。人間の触覚や力覚には双方向性があり、どのような場合にどう腕や指を動かせば求めている結果が得られるのかは、熟練者なら意識することなく瞬時に判断できる。しかし、ロボットに同じような判断や動作を自律的に行ってもらうことはとても難しい。文字を1文字書くにも膨大な量の位置情報や速度情報、力の情報が必要で、筆や紙などの微妙な違いを感知して適切に制御しなければならないからだ。

　そのような人間ならではの触覚や力覚を含む動作を機械で再現する研究の一つが「モーションコピー」だ。技術の実証のために、人間が筆で文字を書く動作を、腕に付けたアクチュエータのセンサーで感知し、記録、保存して、ロボットアームで再現する実験が行われた。

図1　書道の熟達者の筆使いをアクチュエータで再現したデモ（出典：慶應義塾大学の資料）

　武田双雲氏や紫舟氏、金澤翔子氏の書をアクチュエータで忠実に再現する実験も行ったところ、文字の形をなぞるばかりでなく、力の込め方や運筆の勢いなど達人の動作をほぼ完全に再現することに成功した。実際には、最初の動作情報記録時とアクチュエータの動作時には紙質や筆、墨の粘度などは異なってくるが、それでもうまく再現できるのは、人間が筆で文字を書く時の反力や動作に影響する外部条件（外乱）を双方向的に感知して、アクチュエータの動作速度や力を微細にコントロールしているからだ。

　この双方向性を取り入れて、広くロボットなどの機械制御に役立つAIを開発しようと取り組んだ技術が「バイラテラルAI」として実を結んだ。

バイラテラルAIの仕組みは？

　「バイラテラルAI」のAIモデルは、次のようなプロセスで作成される（図2）。

図2　バイラテラルAIのモデル作成のイメージ（出典：慶應義塾大学の資料）

（1）設計意図を入力する

　例えば人の腕に付けたロボットアームから収集した情報で理想的な動作を教え込んだり、評価関数を設計、入力したり、既知のモデルを入力したりして、どのような結果を得るためのモデル設計なのかを入力する。

　また演算のための要素（四則演算、微分積分、フィルター、比例、非線形の関数など）のセットを入力する。どのようなモデル表現要素、関数、アルゴリズムを使用するかを決めるのは人間で、ここに人間の知識や経験、技能が生かされる（図2 ）。

（2）コンピュータ（AI）が設計意図に基づき最適な演算結果を導出

　コンピュータが大規模、高速演算力を生かして、上記設計意図に基づく最適な演算結果を導出する（図2 ）。

（3）演算結果を評価して、必要に応じた設計意図を入力する

　導出された演算結果を人間が解釈し、必要に応じて新たに設計意図を入力する（図2）。例えば最適な結果が出力されても、期待したものよりも精度が低いと人間（熟練技術者など）が評価したら、演算要素を新しく追加するなどして設計意図入力をやり直す。

　人からAIへ、AIから人へと（1）～（3）の作業を繰り返していくと、徐々に簡素なモデルから高精度なモデルへとAIが成長していく。また、入力した設計意図に従って最適化した結果をその都度人間側でも知ることができ、新しい気付きが生まれる。

　設計意図に問題があると気付いたら、別の要素を新しい設計意図として盛り込んだり以前の要素を削除したりしながら、何度も繰り返して最適化できる。これが、人とAIとの対話であり、協働することの意味だ。このようなAIモデルの作成（階層的抽象化）を行うことにより、熟練技術者などの属人的なノウハウやスキルをモデルにうまく取り込むことができる。

　またディープラーニングでは学習が進みすぎると、ノイズが増えて望む結果が得られなくなる「過学習」が問題になるが、バイラテラルAIの学習過程では人間がその都度結果を判断するため、過学習の心配がないことも特徴の一つだ。

　そして重要なポイントは、人間が設計意図として入力する関数や演算要素、アルゴリズムなどは、全て物理的な意味が明確になっているため、それを利用したAIモデルも演算結果の物理的意味が明白になること。つまり数式で表現できるようになるるわけだ。

　数式で表現したモデルなら、ノウハウデータベースやスキルデータベースとして蓄積可能になる。ひいては熟練技術者のノウハウやスキルを幅広く、また世代を越えて共有可能になり、将来的なロボットや産業機械の作業領域の拡大、人材の育成、訓練、技術継承などへの活用が期待できる。もちろん、物理的に説明できる結果が出ることで、クリティカルな制御応用シーンであっても安心して適用できるものになる可能性が高い。

AIモデルは具体的にどう使えるのか？

　ある適用例を見てみよう。図3のようにロボットアームで物をつかむときに影響を及ぼす要因には、速度に伴うクーロン摩擦と粘性摩擦、加速度に依存し質量にも関わる要因、重力に依存する要因などさまざまなものがある。

　AIモデルの作成過程でそれらの要因の中から支配的な影響を与えているものを割り出した上で、影響の大きなものを格付けしてそれぞれを数式化し、その影響を取り除くように動作のパラメータを調整することも可能だ。その機能を持つ「外乱補償器」をロボットアーム制御システムに加えれば、周囲の環境変化にも影響されない精密な精度での制御が可能になる。

図3　バイラテラルAIのモデル適用例（出典：慶應義塾大学の資料）

バイラテラルAIの応用領域は？

　バイラテラルAIは現在、桂氏の研究室と東京自働機械製作所とが協働し、システムに適用されようとしているところだ。上述のような、非線形性の強い摩擦現象のモデリングをはじめ、熱システム、生産ラインのばらつきなどの課題に適用して効果を検証している状況にある。

　例えば、ばらつき解消の例として、東京自働機械製作所の事業の一つである包装機械に応用したコーヒー粉末の袋詰めの最適化事例がある。

　粉末は温度や湿度に影響されやすく、500グラムなど一定量の袋詰めをしようとしてもぴったりとはいかず、表示重量を下回ってはいけないので常にいくらか余分な分量の粉末を袋詰めしていたという。

　バイラテラルAIを利用すると、非線形な粉末のふるまいをフィードバックして包装機械を適切に制御することで、決められた量に近い分量での袋詰めが可能になった。従来は熟練の担当者だけができた包装機械の調整が、バイラテラルAIによって未経験の人でもできるようになったという。

　製造、生産現場では、さまざまな種類のばらつきの問題が起きている。その問題解消がAIによって可能になるだけでなく、その理由もきちんと説明できるとしたら、マネジメント層にも広くAI活用への理解が得らえ、さらに大きな改善に結びつく可能性がある。

　桂氏はさらに、「生産現場の省人化＝無人化工場」も視野に入れ、リモートメンテナンスやリモートモニタリングと組み合わせたAI活用を考えているところだ。また東京女子医科大と共同して、四肢に障害のある人のリハビリ目的にロボットアームを利用し、機能回復の支援にもチャレンジしている。目標は作業療法士の動作をモデル化し、さまざまなリハビリに活用することだ。「医療、介護、スポーツ、芸術などさまざまな分野において効率的に、遠隔でトレーニングを行うための支援サービスを提供することも可能だ」と桂氏は言う。

　図4に見るように、バイラテラルAIはモデルの成り立ちが説明可能であるだけでなく、抽象化されたノウハウやスキルのデータベース化ができるところが、一般的なAIに比べて優れている。人の仕事を機械が代替するにとどまらず、人とAIとの対話を通じて双方が成長できるのが大きな特徴だ。また技術継承や、ノウハウ継承は特に製造業では重要なニーズだ。次世代の人材を育成することにも貢献できそうだ。

図4　バイラテラルAIと一般的なAIとの違い（出典：慶應義塾大学の資料）

　桂氏は、「バイラテラルAIを基盤とした遠隔認知、遠隔操作技術によって、ものづくりの分野における『現場』『現物』『現実』の三現主義を守りながらリモート化を実現し、生産現場の時間的、空間的、属人的制約の緩和をもたらし、ものづくりの『どこでも、いつでも、誰でも』化を実現することを可能にします。このフレームワークをアフターコロナや、少子高齢化時代の製造業を支えるための新たなものづくりの技術基盤として普及させることで、ニューノーマル社会における技術革新につながればと思います」と抱負を語った。

AIが文豪になる日は来るのか？　「日本語特化汎用言語モデル」が描く世界
AIが人の創作と見分けがつかない文章を生成できることを証明したGPT-3の衝撃冷めやらぬ今、LINEとNAVERが「日本語特化汎用（はんよう）言語モデル」の共同開発を公表した。それはいったいどのようなものなのか、何を目指しているのか。現時点での到達点を取材した。
AIの精度を保証する「機械学習品質マネジメントガイドライン」とは？
人の生死や資産に直結する領域にまで手を伸ばそうとしているAIだが、その判断や予測の精度を左右する機械学習の品質については気掛かりなところ。そこで登場したのが、世界でもほとんど例のない、汎用的な品質管理ガイドラインだ。
自動交渉AIとは？　利害をAIが調整する時代がやってくる
「あちらを立てればこちらが立たぬ」というジレンマは仕事でも生活でもよくあることだ。お互いが自分の目的に最適だと思う行動計画が相反するとき、どう折り合いをつければよいのか。そんな古くからの悩みを解決し、みんなが得する最適行動へと導いてくれる「自動交渉AI」が実現しそうだ。