情報システム学会 メールマガジン 2012.7.25 No.07-04 [9]

寄稿 人工知能と知的社会インフラ

慶應義塾大学理工学部 教授 山口高平

1.はじめに

 最近、人工知能あるいはAI(エーアイ)という言葉が、メディアでよく聞かれるようになりましたが、人工知能が知的社会インフラになる可能性はあるのでしょうか?
 AIの研究は、1956年のダートマス(アメリカ中西部の都市)会議まで遡ることができ、すでに半世紀以上の歴史を持っています。AIの研究を簡単に振り返りますと、1960年代は、数学の定理証明やチェスを対象にして、一般問題解決器(GPS)やA*アルゴリズムのような探索の研究、および、コンピュータ上での三段論法を実現する導出原理(Resolution Principle)のような演繹推論の研究が進みました。しかしながら、対象問題が定理証明やゲームから脱却できず、AIはToy Problemを扱うだけと批判され、1970年代は総じてAIの研究は沈滞し、1977年に人工知能国際会議(IJCAI)で、ファイゲンバウム教授(スタンフォード大)がThere is power in the knowledge!という有名な言葉を残され、1980年代は、AIの研究は知識工学(外部世界から知識を獲得し、コンピュータ上で知識を表現し、知識を利用して問題を解決する)の研究開発に大きくシフトし、日本の第5世代コンピュータのような国家プロジェクト、産業界では、専門家の知識をコンピュータに移行して活用するES(エキスパートシステム)、AIベンチャーの勃興など、AIの研究開発は大きく発展しました。しかしながら1990年代に入り、人間の持つ知識の奥深さ、コンピュータに常識を持たせることの困難さ、質の良い知識を獲得することに大きなコストがかかること、獲得された知識を維持することも大変であることが認識され、世界で5000程度開発されたエキスパートシステムの2/3は動かくなり、AI研究開発はまた沈滞期に入りました。
 一方1990年代に入り,インターネット上のハイパーテキストシステムであるWWW(World Wide Web)が登場し、この20年間のWWWの進展ぶりは言うに及びません.現時点で,EMCのdigital-universeのサイトでは,デジタル情報量はほぼ2,000EB(エクサバイト)=2ZB(ゼッタバイト)に到達しています(1)。個人が情報を発信し,ソーシャルメディアが普及し,口コミ情報が流通した結果,情報の非対称性(送り手が受け手より,多くの情報を有する状態)が崩れてきました.この20年間で,Webは人々にとって日常生活に欠かせない社会インフラとして成長し普及したといえます.
 一方,1990年代以降の20年間,AIの進展・普及ぶりはどうでしたでしょうか?実際は,様々な研究開発が進展していますが,世間からは遠い存在になってしまった感があります.最近,テレビ・ラジオ・新聞などのマスメディアの人達と交流する機会が増えましたが,彼らからの第一声として「最近,AIって聞かないですよね.どうなっているのですか?」というような質問が飛んできます.
 ただ2年前,日本で,あから2010が女流将棋王将に勝利し,昨年米国で,ワトソンが長寿クイズ番組ジェパディのグランドチャンピオンに勝利し,お掃除、ひげそり、節電などの分野で制御系AIが活躍し、今年になって、将棋AIが元名人に勝利し、囲碁AIがハンデ戦ながらも元名人に勝利し、スマートフォンアプリでSIRIやおしゃべりコンシェルジュが活躍しています。世間も再度AIに関心を持ち始め,風向きが変わりつつあるようにも思えますが,今まで、発展期と沈滞期を繰り返してきたAIが、今度こそ健全に発展し,インターネットのように社会資本にまで成長するかといえば疑問が残ります.
 筆者は,定理証明,ES,機械学習,データマイニング,オントロジー,セマンティックWebと長らく記号処理畑を歩んできましたが,以下,オントロジーの研究開発経験を例にとり,AIシステムが健全に成長し普及して,知的社会インフラにつながる可能性について論じてみたいと思います.ただし、本稿は(2)を元に加筆修正したものです。

2.この20年間のオントロジーの様相

 すでに述べましたように、1980年代,多くのES,それに伴って多くのRB(ルールベース)が開発されました。しかしながら,RB開発者(領域専門家)が変わってしまいますと,RBの開発背景や文脈は外在化されていませんので,新しく異動してきた領域専門家にとってはそのRBの意味を把握できず,RBの維持発展が困難となり,90年代以降ESはあまり開発されなくなりました.例えば,「IF オーバーヒートandエンジン正常 THEN 電気系統故障」という車の故障診断ルールがあった場合,オーバ−ヒート,エンジン,電気系統,正常,故障の定義(仕様)がなかったために、知識が継承できなかったことが、開発されなくなった理由です.そのため、知識工学の研究分野では,知識を構成する単位(モデリングプリミティブ)の仕様としてのオントロジーの研究が開始されました(Tom Gruberという人が、オントロジーを情報科学の分野に導入しましたが、SIRI開発のCTOです.たぶんSIRIにもオントロジーが採用されているのでしょうね)。
 筆者もそのような問題意識から,オントロジーの研究を開始しましたが,90年代にオントロジーの研究発表をすると異分野の研究者からは結構疑問の声があがりました.ソフトウェア工学からはオブジェクト指向やUMLダイヤグラムと何が違うのか,データ工学からはデータディクショナリと何が違うのか,単に,仕様の表現形式が違うだけではないのか?という意見が相次ぎました.オントロジーは,人と人のコミュニケーション支援という側面もあるので,このような誤解も仕方ないのですが,最終的に「人だけでなく,コンピュータが仕様を理解し処理できる」ことが最大の差異です.UMLやデータディクショナリは人間が理解するためのものであり,コンピュータが理解し処理できるものではないと主張しても,「コンピュータが仕様を理解し処理できるといっても,またAI特有のトイな話しであろう」という感じで,1990年代後半は,なかなか議論が噛み合いませんでした.
 2000年代に入り,コンピュータがWebページの意味を理解できることをめざしたセマンティックWebが登場し,オントロジーがその中核技術として位置付けられ,徐々に議論が噛み合い,Web工学,データ工学,ソフトウェア工学においてもオントロジーという用語が使われ始め,この10年間でオントロジーは,学術的には,かなり進展し普及してきたと思います.しかしながら,オントロジー技術が,情報システムのインフラにまで成長したかといえば,まだまだ遠い感じがします.どのような目的で,どれだけのコストをかけて,どの程度のオントロジーを作れば,どのようなユーザに,どれだけ役立つのかという,B(enefit)byC(ost)の議論が成熟していかないと,組織・個人が使う情報システムのインフラにまで普及するのは難しいと感じています.以下の章では、この点について考察します。

3.オントロジーの使い方

 オントロジーの開発環境は整備され「作り方」は成熟してきましたが、「使い方」を間違えると結局普及しません.以下,組織とオントロジーの関係について考えてみます。
 2006年から5年間,ある組織の現場における知識継承(KT)にオントロジーを利用するプロジェクトに関わりました.知識の専門性の高さから,開発はすべて人手に委ねられ,オントロジーとKTツールの開発には大凡200数十時間を要しました.その間,「オントロジーは本当に知識継承に役立つのか?」,「時間ばかり食って大した成果は出てこないのではないか?」という疑問・批判の声があがり,プロジェクトは途中で頓挫しそうになりましたが、プロジェクトは何とか継続され,最終的に,KTツールによる訓練された新人の能力とOJTにより訓練された新人の能力を比較することになり、その結果、獲得された能力はほぼ同等で,教育時間は約1/4に短縮されることが判りました.
 また,ルールの背景理由を整理したルールオントロジーを開発しました.このオントロジーは、現場ルールと経営戦略を結びつけ,経営戦略が変化すれば,リンク構造によって,現場ルールの優先順位も変化することが可視化でき,職層の壁を取り払い,組織の見える化が進むと評価されました.このように,教育時間の短縮,組織の見える化など,オントロジーが経営に貢献できることが示され,最終的に,本プロジェクトに対する組織の評価は高くなりました。(3)

4.オントロジーの伝え方

 最近,テレビ・ラジオ・新聞・雑誌等のマスメディアの人達との交流が増え,一般読者・視聴者に判りやすいオントロジーの説明を求められますが,これが意外と難しいです.
 「オントロジーとは,モデリングプリミティブを定義したものです.」
 「オントロジーは概念化の明示的仕様です.」
 「オントロジーとは,クラス,プロパティ,インスタンスのことです.」
などのように説明しても,一般読者・視聴者に伝わるはずもありません.
 しかしながら,メディア関係者は,私の小難しい説明を判りやすく言い換えてくれました.以下,メディア関係者によるオントロジーの説明を紹介します.
 (4)では,オントロジーを利用した知識継承システムの記事中の用語説明として掲載されました.本記事は,元々技術欄の小さな記事として掲載される筈でしたが,社会的インパクトがあるという編集デスクの判断で,1面の中央に大きく掲載されました.RDFレベルの説明を単語の紐付けと説明し,クラス階層を具体的・抽象的なレイヤーと説明されています.(5)では,ラジオの生放送で,パーソナリティの方が,事前打合せもなく,私のオントロジーの説明をその場で聞いて,アドリブで,人脈という言葉の連想から,「言葉の脈,語脈」という言葉でオントロジーを説明されました.RDFレベルの説明に限定されますが,パーソナリティの方は,さすが,言葉のセンスが磨かれているなぁと感心させられました.以後,様々な場面で,「語脈」という言葉を使わせてもらっています.
 一般読者・視聴者に判りやすくオントロジーを説明するには,頭の中でイメージしやすい言葉を使う必要があると痛感しました.現在,一般の方々にオントロジーを説明する時,具体例を交えながら,RDFレベルの説明として「言葉の繋がり方」,RDFSレベルの説明として「言葉のまとめ方」を使っており,「人・もの・ことを繋ぐ」ものがオントロジーですというような説明をすると,オントロジーが広がっていくのかなと感じています.

5.おわりに

 現在、日本の産業の閉塞感が、様々な形で論じられています。いわゆる、自社の強みを伸ばして、改良商品を開発していく経営では、世の中の変化に置き去りにされ、結局、破綻してしまう、あるいは、従来型ITでは、もはやイノベーションは期待できず、新たな顧客を創造する手段になりえない、というような議論まで見受けられます。
 ICTの世界では,最初はおもちゃ扱いだったガジェットから破壊的イノベーションが生み出されてきています.1980年代,ガジェットにしか過ぎなかったパソコンがメインフレームを圧巻し始め,1990年代,回線交換からみれば通信品質を保証しない,ガジェット同様のパケット通信(インターネット)が社会資本になり始め,2000年代,漏れやSEOスパムでガジェット扱いだった全文検索エンジンが検索連動広告で広告メディアのコア技術に育ってきました。
 NHKサイエンスZEROで「人工知能がクイズ王に挑戦」という番組でワトソンの技術解説の役目を担いましたが(6)(7),ワトソンの勝利は,画期的なAI技術が発明されたからではなく、多くの既存AI技術をうまく組合せ、研究者同士が議論に議論を重ね、個々のAI技術を改良していった、チームワークにあったと締めくくりました.
 イノベーション=インベンション(新しい技術の考案)+インサイト(その技術がどのように使われると有用になるかを深く洞察)と説かれることがありますが,インベンションだけではだめで,インサイトとセットで考えよということなのだと思います.AI技術と情報システム要素技術を連携させた面白いガジェットの中から、知的社会インフラが出現する日を信じて待ちたいと思います.

参考文献

(1) http://japan.emc.com/leadership/programs/digital-universe.htm
(2) 山口高平:AI システムが知的社会インフラとして成長していくために 〜つくって・使って・伝えよう〜,人工知能学会誌,Vol.26,No.6, pp.626-630 (2011)
(3)岡部雅夫, 小林圭堂, 石川達也, 飯島正, 山口高平:知的熟練の持続的表出化支援システムの構築, 情報システム学会誌, vol.6, no.1, pp.76-102 (2010)
(4) 慶大と東電「暗黙知」で施設管理 人工知能技術応用 熟練ノウハウ伝授(日刊工業新聞 朝刊1面,2011.3.3 )
(5)くにまるワイド ごぜんさま (AM1134文化放送,2010.7.12 )
(6)人工知能がクイズ王に挑戦!前編 ワトソン誕生(NHK教育テレビ:サイエンスZERO 2011.4.15)
(7)人工知能がクイズ王に挑戦!後編 いよいよ決戦(NHK教育テレビ:サイエンスZERO 2011.4.22)