自分でデータを集めて最適化を実現する「自己競争AI」とは？：5分で分かる最新キーワード解説（1/3 ページ）

サプライチェーンの「発注課題」に着目した、自己競争により学習を行うビジネス向けAI技術「自己競争AI」が登場した。

» 2018年05月23日 10時00分公開

[土肥正弘，ドキュメント工房]

　今回のテーマは「自己競争により学習を行うビジネス向けAI技術」だ。今回は、サプライチェーンの「発注課題」に着目してAI群の競争と協調により在庫、欠品コストが約4分の1にまで低減できる可能性を示した。多くの事業所や企業が関わりながら、お互いの状況や出方が分からない現実のビジネス現場において、利益を最大にする方法を探り出すためのAI活用研究の一端を紹介しよう。

「自己競争AI」って何？

　日立製作所研究開発グループの基礎研究センタが開発に取り組む、実際のビジネスでの意思決定に適用しやすいAI利用技術の1つ。複数のAIからなるAI群を幾つか用意し、AI群同士を互いに競わせる中で学習を進め、不確定要素の多いケースでも、課題に対して最適なビジネス戦略の発見につながることが期待できる技術だ。まだ一般用語でもなく商標でもないが、本記事ではこれを「自己競争AI」と呼ぶことにする。

　ビジネスへのAI適用は画像認識などの限られた領域でこそ一定の広がりを見せているが、具体的なビジネスケースでの意思決定に結び付けた事例はまだ少ない。豊富にあるデータを材料に、上手に分類、処理して役に立つ情報を取り出すのが現在のAIの主流だが、データが十分に得られない中で、相手の動きを予測して最も利益が上がるビジネス戦略や戦術に結び付けるAI応用法はまだまだ未開拓な状況にある。

　その一方、AI技術開発の典型例として報道されることが多い囲碁などのゲームにおいては、AI同士が対戦することで新しいデータを生成され、それを学習することでAIがさらに賢くなる実例が知られている。そのような「AI同士の対戦」を現実に近いビジネスシチュエーションで実行し、近未来のビジネスパフォーマンスを改善できないか。それがこの研究の焦点である。

「ビールゲーム」で熟練者を上回る結果を出す

　この研究では、サプライチェーンにおいて本質的な課題とされる「発注問題」を抽出したモデルを俎上に上げた。経営研修などでも多用されている1960年代に考案されたシステムダイナミックスのシミュレーション「ビールゲーム」を、人間ではなく多数のAIに競わせたのである。

　ビールゲームは、商品（ビール）の小売業者、卸業者、仲卸業者、工場が関わるサプライチェーンにおいて、消費者の需要に適切に応えながら、サプライチェーン全体での受注残（販売機会損失）や在庫量（在庫コスト損失）を最小限にすることを、4人1組のチームで競うものだ。

図1 「ビールゲーム」のあらまし（出典：日立製作所）

ビールゲームのルール

1人のプレイヤーが1つの拠点を担当
プレイヤーは、1ターンごとに、配送してほしいビールの量を上流に発注
- 情報として、自拠点情報のみ利用可能（在庫、受注残、入荷量、出荷量、受注量、発注量）
- 拠点間の発注・配送には遅延（2ターン）が存在
35ターン後、4拠点全体の累積コストを評価
- 拠点当たりコスト＝受注残＋ 0.5 × 在庫量（1ターンごとに計算）

　このゲームがプレイヤーに突きつけるのは主に2つの難題だ。

　1つは、サプライチェーンで隣り合う業者がどう動くのかが確実に予測できない中で、最適な発注を行うことだ（不完全情報ゲーム）。過剰在庫はコストを引き上げる一方、在庫を減らすと欠品を招き利益が上がらない。

　現実には予測不能な需要変動が前提となる上に、相手側の在庫や欠品などの情報を互いに共有せずに発注量を決めざるを得ないため、いつどれだけの量を発注するのかは大変に難しい問題だ。囲碁などでは相手の状態が誰にでも分かるが、こちらは見えないので論理的に結論が導けないのである。従って、実際のビジネスでは過去の実績の知識に加えて担当者の経験と勘による発注のさじ加減が重要な要素になっている。

　もう1つはゲーム理論の教本に必ず登場する「囚人のジレンマ」だ。本当は自分が最大利益を追求するのを止めて少しだけ損をすれば全体がトクをすることが分かっていても、関係する他社が同じように考えなければ自分が大損をするために、全体最適に至る意思決定ができない状態（ナッシュ均衡）に陥るのがこの「ジレンマ」である。

　相手の出方を予想しつつ、自分の利益を最大にするために考えをめぐらして最適と思われる意思決定を行っても、他のプレイヤーの思惑によって結果が左右されてしまうのが現実のビジネス。その微妙で複雑な構造をシンプルにシミュレーションするのがこのゲームだ。

　ビールゲームは35ターン（週単位の受発注シミュレーション）以上繰り返され、最終的にはチーム（小売店、卸、仲卸、工場など）内の総コストが最小だったチームが勝ちとなる。ビールゲームは歴史が長いだけに熟練者によるプレイ成績が蓄積されており、それと比較してAIがより少ないコストで終了できればAIの利用価値があることになる。

　35ターン後の在庫、欠品累積コストが熟練者（人間）によるプレイの場合は2028ドル（マサチューセッツ工科大学の同ゲーム開発グループによるデータ）だったのに対し、日立の「自己競争AI」による検証では489ドルに低減したという。約4分の1にまでコスト圧縮できることになる。

　図2は人間（ここでは日立の社員）のプレイと、「自己競争AI」技術で学習を終えたAIによるプレイのアウトプットの例である。人間のプレイでは工場の受注残が増え、卸や小売の在庫も増えるのに対し、AIのプレイでは初期値（最適状態）が多少変動しながらもよく保たれているのが分かる。