-------

   IBMのWatsonとは?
     未踏チャレンジ・イノベーションに使えるか? 07.01.2017

               



 α碁が人間の脳の機能を真似たものと言われるニューラルネットワークという考え方に基づくAIであるとしたら、IBMのWatsonというものは、どのようなものなのでしょうか。やはり脳のような機能を持つと考えれば良いのでしょうか。

 前回取り上げましたが、α碁に使われたニューラルネットワークを進化させれば、新しい材料開発がヒトによる実験という作業なしでできるという主張は、「応用分野の性格が全く違うから、まだまだ先のことになると思う」、という答えで良いと思うのですが、医療分野などでWatsonの応用は今後拡大の一途になるのではないか、と予想されていますので、材料開発分野でも、Watsonなら活躍することは確実で、そのうち、ヒトによる実験は不要になる、という推論がある程度の正当性を帯びているようにも思えるのです。

 しかし、一方で、そのような予測がでる理由は、材料開発というものの本質を十分に分かっていないからのではないか、とも思えます。

 今回の主要な目的は、全く新規な材料開発は、やはり、Watsonがあってもかなり難しいのではないか、少なくとも、これは、現実には無理なのですが、「失敗事例がすべてWatsonに入力される」までは、難しいという主張をしたいと思います。

    
C先生:IBMのWatsonがこのところ、様々な分野で使われ始めている。そもそもWatsonとは何か。その実態を知ることが重要のように思える。IBM自身が、WatsonをAIであると呼ぶことは適切ではない、とも理解できる表現を使っている。それは、IBMは、「Watsonは、自然言語を理解・学習し人間の意思決定を支援する『コグニティブ・コンピューティング・システム(Cognitive Computing System)』と定義している」ので、「なるほどそうか」と思う訳だ。まず、そもそもWatsonとは何か、ということから理解してみようか。

A君:より正確なIBMの表現は、こんな風です。
 IBMは、AIを「Artificial Intelligence(人工知能)」ではなく、「Augmented Intelligence (拡張知能)」として「人間の知識を拡張し増強するものと定義し、IBM Watsonを中核とするコグニティブ・ソリューションとしてお客様に提供しています。IBM Watson(ワトソン)は、自然言語処理と機械学習を使用して、大量の非構造化データから洞察を明らかにするテクノロジー・プラットフォームです」。

B君:AI(人工知能)ではない。頭文字は同じAIでもAugmented Intelligence (拡張知能)だというのだ。現時点で、WatsonのWebサイトのトップに二つの動画があるが、一つは、簡単な自然言語の能力を使って、子供と会話をするおもちゃが動作している状況の動画で、こちらは、まあよくできているけど、用途がおもちゃではモッタイナイ。もう一つが、「コグニティブ・コンピューティングの将来」というWatsonの本質に近い動画。そこで何人かが登場して、Watsonで未来がどうなるか、について短い発言をしている。そこで、もっとも衝撃的な発言は、1分30秒からの発言。「私は、コグニティブなアシスタントの支援があれば、地球上のすべてのプロはその分野における最高のプロになれると考えている」。要するに、インテリジェンスのプロがどのぐらプロであるかは、Watsonを使えるか、使えないか、で決まってしまうという主張だ。

A君:コグニティブという言葉ですが、勿論、cognitiveなのですが、通常、「認知」とか「認識」とか訳します。しかし、ここで使われているcognitiveは、むしろ、「経験的知識を認知しているWatoson」によるアシスタントが、どのようなプロをもトッププロにする、という主張ですね。

B君:「経験的知識を認知」とは何を意味するか、ということになる。その動画のそのメッセージの前、40秒ぐらいのところで、現時点におけるWatsonの最大の応用分野である、医学分野についてのメッセージがある。「医療の記録システムにアクセスして、関連するすべてのデータを吸収する。その学習速度は、人間よりも当然速い。その結果、その時点での最新・最良の治療の適用が可能になる」

A君:ということは、「経験的知識」という訳は必ずしも正しいとは言えないと思いますね。「学習された最新の情報を含む過去から蓄積された知識全体≒学習された結果、有用であると認知された知識全体」という意味だと理解すべきでしょう。

B君:Watson以前だって、Google検索が使えるようになってから、プロかどうかは、記憶力の勝負ではなくなった。これまで、プロがプロである理由は、明らかに経験という名称で語られる知識の蓄積量だったと言える。その知識は、書籍や文献から得られたものだけを意味するというよりも、むしろ、どのぐらいの人と会話をし、そして、実践する過程で得られた「莫大な知識のうち、有用な場面別に整理された知識」といった感じだろうか。実は、現時点でも、プロの定義は変わらない。

A君:ということは、その知識へのアクセススピードとレスポンスがプロとノンプロの違い。トッププロとは、どんな質問に対しても、即刻なんらかの反応をしつつ、できるだけ短時間に、相手が真に求めている情報を提供する人でですよね。その質問は分かりましたが、答えは一週間待ってください、という態度ではプロではない。

C先生:Google検索が無かったころは、それこそ図書館に通って、ケミカル・アブストラクツ(ケミアブ)あたりをじっくり探す方法以外では、必要な情報はなかなか見つからなかった。万一、見つかるとしても、それまでに相当な時間が必要だった。インターネットの歴史は、検索技術の歴史だ。個人的には、本当の黎明期からインターネットを使っていたのだけれど、Yellow Bookと呼ばれる電話帳なみの厚さの本があって、そこで、日本全体で登録されているすべてのWebサイトが分かるという本だった。その後、Yellow Bookに登録されたサイトをダウンロードして検索するという方法も一時期採用されたのだけれど、人力でのカバーはすぐに不可能になった。そして、ロボットと呼ばれるソフトが、自動的にすべてのWWW(worldwide web)上に存在するサイトを巡って、情報を集めて、それをキーワード化して、検索ができるようにするという仕組みだった。この、基本的には今でも変わらないのだけれど、当初、infoseek とか gooといったロボット型検索ソフトも使ったけれど、やはり、Google検索が使えるようになってから、便利さとスピードで、どうしてもGoogleに依存することになった。

A君:今なら、一週間待ってください(その間にGoogleで調べてみますから)、という行為ならば、学生から社会人までほとんどすべての人に可能になっている。となると、現時点でのプロかアマかの区別は、得られる情報は同じだけれど、その中から、本当に有用な情報を選択する能力と、その内容を解釈する力、そして、レスポンスがどれほど違うか、という点に集約されますね。

B君:同じ情報を与えても、出てくる答えの質が違う。学生であれば、同じ情報でレポートを書いても、なぜか評点が違う。これはなぜか、ということがプロと非プロの初歩段階での違いだということか。

A君:そうですね。この質問に関する最新の知識の限界は、まあ、このあたりだろうから、その限界点に近いところまで情報を集めれば、それ以上は不要、ということを理解しているかどうか、それがプロか非プロの違いなのでは。

B君:ということは、Watsonがやっていることが通常のプロを超えているというのなら、例えば、医療分野なら、現状はここまで進歩した、という境界線のようなものを常時なんとなく認識していて、それを元に各種の新規情報を解析し、妥当なまとめができること、で勝負しているということなのではないか。そして、1ヶ月後には、過去の境界線を超えて、情報の蓄積量が進化していると、同時に、その認識そのものが進化している。

A君:ちょっと探してみますと、こんな文書が見つかります。
https://www.m3.com/open/iryoIshin/article/498326/
 IBMのWatson事業部ヘルスケア事業開発部長の溝上敏文氏は、次のように語っています。
 「Watsonの大きな特徴は、大量の文章を読み解き、それを理解し、人間の目では分からなかった新たな関係性を見いだすことができること。診断が容易ではなかった症例でも、患者のデータを基に、文献やガイドラインなどから最適な治療方針の候補を見付けたり、既存の薬とタンパク質や遺伝子などとの新しい関係性を示すことができれば、その薬の適応拡大につながるなど、その活用範囲は広い」。

B君:「人間の目ではわからなかった新たな関係性」を見出すことによって、ある薬の「適応拡大」につながるということを主張しているのだが、適応拡大のより詳細な表現は、先程、我々が行った考察、すなわち、現状を常時把握しているので、Watsonは、その適応範囲が広がったことを明確に判断することができる。すなわち、境界線をダイナミックに示すことができる、ということを意味するのではないだろうか。

A君:この記事を書いている橋本佳子編集長は、溝上氏の発言として、次の発言が重要だと思っているようです。「各業界には、大量のビックデータがあり、それを有効活用するためのインフラ構築が始まったが、中でも注目されているのが医療分野。膨大なデータがあるものの、それがうまく活用されておらず、一方でさまざまな解決すべき課題を抱えていたからだ。医療分野は多岐にわたるため、IBMではまずがんの領域に特化して、テキサス州立大学 MDアンダーソンがんセンター、ニューヨークのスローンケタリングがんセンターなどと協力して、研究開発を始めた」。

B君:これは、恐らく編集長の意見だと思うけれど、「がんの場合、がん種を超えて有効な薬が少なくない。全ゲノムシークエンスの結果を解析し、がんの原因となる遺伝子変異を見つけ、適応外の薬も含めて選択肢を提示することなどが期待できる」、といった記述をしている。これは、正しい記述だ。しかし、2017年の2月に書かれている割には、がんという病気に対する日本の医療の現状を知らないように思える。

A君:そうですね。がんの場合には、原発不明がんという言葉がありますが、6月中旬のNHKの「ドクターG」のテーマでもありました。腹水からがん細胞が見つかるという患者で、本来であれば、どのどこかの臓器のがんが元々のがんであり、それが、腹膜に転移しているという証明が必要。抗がん剤とは、もともとその細胞がもっているDNAの特徴に基づく弱点を突くような物質であると考えれば、原発不明がんには、抗がん剤による治療はできないのは当然。しかし、がん細胞を採取して、そのDNA解析を行うという方向性は、すでに確立しているようですので、近いうちに、原発不明がんという名称は消えるかもしれませんが、日本ではどうなるか。

B君:「ドクターG」によれば、米国では、National Cancer Instituteにおいて、原発不明がんの治療のガイドラインができている。それによれば、腹水に腺がんが見つかれば、卵巣がん用の抗がん剤が有効、と書かれているとのこと。

A君:そんなことがどうやって見つかったのか、ということになると、一つは、米国の医者の分業という境界を乗り越える度胸ではないですか。腹水が溜まっているという状況は、通常だとステージWのがん、すなわち、最終ステージということなので、可能性がある治療法は勇気をもってすべて試みる、という態度があるので、結果的に、新発見につながるのでは。

B君:日本だと、がんの部位別に医者が居るので、他人の領域を犯す可能性のある原発不明がんは自分の領域ではない、という判断をお互いに下しがちのように思う。さらに言えば、抗がん剤という治療方法を横割りで専門にする腫瘍内科医が、日本では少ないとのことなのだ。

A君:一方、米国では、度胸のある医者が充分に幸運なら、腹膜に腺がんがあるケースでは、卵巣がん用の抗がん剤が有効であるということを見つけ出す。その結果が論文化されれば、Watsonがそれを見つけ出し、最終的にはガイドライン化される。これが事実かどうか、検証した訳ではないですが。

B君:情報の質という点から考えてみると、そんなことができるのも、実は、医学に関する情報が、人体という共通のものをベースにしているために、情報が整理しやすいという利点を活用しているとも言える。

A君:臓器の機能は、個人差が少ないですよね。しかも、幸いなことに、臓器の種類は、それほど多い訳ではない。したがって、がんの原発臓器と言えば、それもそれほど数が多い訳ではない。

B君:臓器は何種類あるんだっけ。

A君:分類は、例えば、腸をいくつに分けるかで、色々ですが、腸を一つだと考えると、20種以下ぐらいと言うことで良いのでは。

B君:がんの原発臓器としてだと、腸をいくつかに分けるのだろうね。だから食道も独立の臓器なのだろう。

A君:いずれにしても、20種程度であるということであれば、整理・分類が極めて容易ですね。しかし、それが分業も容易であるということにつながるのが日本。

C先生:医学、特に、がんについては、まあそんなことだ。これから、考えるのは、「未踏チャレンジ」とイノベーション。2050年におけるCO2削減に利く技術というと、現時点で可能性が高いことは、新材料と新プロセスの発見ということになると思う。となると、新規に材料を見出すために、あるいは、全く新規なプロセスを発見するためにAIやWatsonがどのぐらい有効なのか、ということになるのだろう。

A君:この分野、残念ながら、医療分野に比べると、見通しが茫洋としていますね。

B君:それはそうだ。新材料となれば、どの元素をどのぐらいずつ使うか、ということになるのだけれど、その可能性は無限。新プロセスといっても、プロセス自体が、圧力、温度、規模などによって種類は無限。しかも、そこで使う新規な触媒を探そうということになれば、それは、触媒も新材料なので無限だ。

A君:まあ、その通りでして、現実に触媒を含めて材料に使える元素というものが何種類あるのか、となると、原子番号1番の水素から、92番のウランまでで92種類。ただし、原子番号43番のテクネチウムTcと89番のアクチニウムAc、91番のプロトアクチニウムは、材料としては使われないと思います。なぜなら、安定同位体が存在していないので、別の元素に変わってしまうから。

C先生:ちょっと、回り道になるが、先日、理由はお分かりになる読者も多いと思うけれど、骨がんの検査というものを受けた。幸いにして、問題なしという結論だった。やり方は、造影剤を注射して、2時間後ぐらいに、「骨シンチグラフィー」という装置で、全身の骨のイメージが得られる。黒い部分ががんだということになる。
 その造影剤というものがすごい。テクネチウムという放射性元素とリン酸との化合物がその中身。その放射線量もすごい。総量370〜740MBqと猛烈に多くて、PETの185MBqを上回るのだけれど、半減期6時間で、PET用のフッ素18などの半減期よりも3倍ぐらい長い。しかし、被曝量が問題になることはない。なぜテクネチウムを使うのか、というと、この元素は、生体が利用していない元素だから。すなわち、体内の特定の臓器に蓄積されることもないのだ。だから排出速度も速い。この元素の地球上での存在量は「超微量」だから、生体にとっては使い勝手が悪いので、この元素を有効に使う生命は誕生しなかった。
 骨がんが黒く表示されるということは、まず、リン酸との化合物なので、注射されたテクネチウムは骨に吸収されるけれど、がんは、活動的なので、多くのテクネシウムを取り込む。その量の違いで、イメージングができる。

B君:人間という生物にとって材料科学的には有用でないテクネチウムでも、医学用としては有用だということだ。それも、人体の元素組成は、それほど複雑ではないからかも。大別すれば、構造用の組織は、骨、歯などの硬組織と軟部組織に分かれ、軟部組織は、結合組織(腱、靭帯、筋膜、皮膚、脂肪組織)、血管、横紋筋、平滑筋、末梢神経ぐらいに別れるが、まあ、組成的に見れば、硬軟の二種類とも言える。このような見方を人体構造科学と呼ぶらしい。勿論、これらに加えて臓器類がある。しかし、組成面で見れば、それほど多種多様ということではない。

A君:臓器類の診断用の造影剤も様々ですが、医用材料は、まさに、先端科学が応用できるぐらいの価格でも実用化されるので、進化が非常に速いですね。

B君:MRI検査の造影剤に使われるガドリニウム製剤も、希土類元素なので、生体は利用していない。室温で強磁性を示す元素は、実は、極めて限られていて、鉄、コバルト、ニッケル、ガドリニウムしかない。しかし、ガドリニウムには毒性があるので、それを錯体という安定な構造にして、医学用に使われている。

C先生:話題が材料科学に近づいてきたところで、本論に行くか。
 最初から結論を述べると、人工知能、あるいは、Watsonという技術を新材料開発や新プロセス開発に応用することは、必ずしも得策ではない
 その理由は、
(1)盤面ゲームと違って、対象の広さとその変化の範囲非常に広く、ほぼ無限大であること。しかも、1手といったデジタル量ではなく、使える元素が限られているものの、それでも結構多種多様。しかも、その配合は、アナログ値である上に、出来上がった材料がどのような微細組織であるかが大きな問題なので、当然、製造プロセスに大きく依存する。すなわち、すべてがアナログの世界。取扱が難しい。
(2)もともと、いくら実験をやっても、成功する確率は非常に少ない。すなわち、ほとんど失敗に終わる運命。「論理的に成功に到る」という道筋が見えない分野。
(3)これが新材料開発というプロセスなので、Watson的アプローチが成功する唯一の可能性は、「失敗事例」というビッグデータがもしあれば、それを活用することによって、できるだけ、「同じ失敗は繰り返さないための人工知能」は成立するようになるかもしれない。しかし、「失敗」と「成功」の距離は、実は、かなり近い可能性があることも考えておかなければならない。
(4)これまで材料科学で設計という概念が若干でも有効で、支援システムが作られたのは、ガラス分野。これは、ガラスという非晶質では、物性はほぼ組成のみの関数として近似することができるから。

A君:非晶質と結晶質では、元々、その世界を支配している根本原理が違うという記述をC先生がやっていますね。非晶質は、組織全体の最適化(トータルエネルギー最小状態の実現)が行われる世界であるので、その組成から期待される平均的な特性しか出ない。日本的な社会なのかもしれない。しかし、結晶質では、ローカルな構造の最適化が行われるために、部分的に特異な構造が現れて、そのため特性にも特異性が出る可能性がある。すなわち、天才が出現する可能性があって、西欧社会に近いのかもしれない。

B君:新材料開発とは、天才児の出現を待つようなもので、システマティックに行うことは、まだできそうもない。だから、いくら人工知能やWatsonが出てきても、これらの技術は極限的な秀才としての能力でしかないので、論理的でない発想が必要な新材料開発の支援への有効性は、本質的に限られているのだと思う。

C先生:まあ、そんなところだろう。失敗例のデータベースがもしも残っていれば、材料開発にとって重要な知見を与えることになったのかもしれない。しかし、そう単純でもない。失敗例というものが本当にデータベースとして有効なのか、となると、失敗データの客観性、すなわち、同じことをやれば必ず失敗するのか、と言われると、いくらレシピが同じでも、ちょっとした混合状態を変えたら、最終結果は違うかもしれない、などと思ってしまう。材料開発の場合には、粉体という微小な固体が原料になることが多いのだけれど、これが元々怪しげな存在なのだ。それに、組成が同じといっても、確かに、原料を混ぜる割合は同じなのだろうけど、もともと原料に僅かに含まれている微量成分まで同じとは言いにくい。二種類の原料ぞれぞれ含まれている不純物が、ある相乗効果、例えば、低融点物質を作るといったコンビである場合と、そうでない場合には、最終結果に影響するということすらあり得る。材料合成というプロセスだが、将棋の1手に比較すると、これが余りにもアナログなのだ。
 さらに言えば、失敗例をデータベース化するという試みは、将来とも行われない可能性が高いようにも思う。まず、成功例であれば、その詳細が学術雑誌に掲載されれば、研究者の業績になるから論文を書く気になるのだけれど、業績としては認められない失敗例を詳細に記述するという気分にはならないのが普通だろう。企業などが失敗例を発表するというインセンティブを持つとも思えない。
 という訳で、様々な科学技術の分野で、そのもっとも根底にあり、イノベーションにとっても重要だと思える材料の発見・開発や新プロセスの開発は、どう見ても、Watsonが認知することも困難な分野のように思えるのだ。
 すなわち、本当の新規開発というものは、実は、過去他の人がやったであろう失敗に、人間が繰り返しながら挑戦する。そして、そのうちに、全く別の失敗を行うことによって、何か成果がでるという世界なのかもしれない。