勅使河原の情報収集

賢い日常生活ライフハックアイデアの箇条書き風まとめ

ブームは終焉?AIの今後の展開は!?

「100人のエンジニアより、1人の天才」(長谷川氏)。「一生涯に一度作れるかどうかというレベルのアルゴリズムを開発できる天才と、それを支えるドリームチームを作る」。

 

新型コンピューター「デジタルアニーラ」
デジタルアニーラは量子コンピューターのように、情報を「0」でもあり「1」でもあるという状態を可能にし、並列的に情報を処理できる。

既存のコンピューターの弱点は、組合せ最適化問題による大量のデーター処理。その課題を突破するのに量子コンピューターの能力のひとつ、アニーリング技術が使える。

スーパーコンピューター「京」が8億年かかる計算を、1秒で処理できるという驚異的なもの。

デジタルアニーラは決して、家庭や職場に置かれるコンピュータではありません。しかし、ネットショッピングをしていたら、不思議と自分の好みにぴったりの商品広告が表示されたり、気候変動予測の精度が高まってより効果的な温暖化対策が示されたり、がんや認知症の特効薬が開発されたりする未来は、私たちにとって身近なものです。

すでにデジタルアニーラは、製造現場の作業効率改善にも使われています。富士通グループのコンピュータ製造の基幹工場である富士通ITプロダクツにおいて、デジタルアニーラを倉庫部品のピッキング作業に適用したところ、作業者の月当たりの移動距離を20%以上短縮させることができました。

 

「データドリブン」

終結果のみならず、厳選を繰り返すその過程のデータを蓄積し、AIで分析します。それによって実験では拾えてこなかったもの、発見すらできなかった抗体候補をたくさん見つけることができます。
これで従来比で20倍以上の新薬候補を見つけることができる。
従来だと候補が1種類しか見つからなかったら、製薬会社ではとりあえず1つでプロジェクトを走らせて、駄目だったら打ち切りというケースがよくある。
この技術を使えば、20の候補でプロジェクトを走らせられる。最後までプロジェクトを走らせることができる可能性が大幅に上がるわけです。

 
MOLCURE

20人程度の研究員が、半年かけてやっと1個の新薬候補を見つけているという状況。2週間から1カ月で、10から20個の候補を見つけ出せる。人が行う作業なので見つけられる範囲にも限界がある。

 

Summit

オークリッジ国立研究所によると、Summitは「1秒間に最大20京回(「20」のあとに0が16個続く)の演算を実行できる」という。スーパーコンピューターの性能を表す標準的な単位に換算すると、200ペタフロップスだ。これは、普通のノートパソコンより数百万倍も速い。これまで世界第1位だった中国の「神威・太湖之光」の2倍以上。

 

マイルストーン

米国、中国、日本、そしてEUは、いずれも1,000ペタフロップスを上回るエクサスケールのコンピューターを開発すると宣言している。この演算能力は、巨大コンピューターにおける次の大きなマイルストーンだ。中国はこのマイルストーンを20年までに達成すると公言した。Aurora(オーロラ)が予定通りに完成すれば、米国は21年にこのマイルストーンを実現できる。

 

データを数学的にレンダリングする手法は一部のタスクのみ有効

意思決定を行うソフトウェアにデータを数学的にレンダリングする手法は、音声認識といった一部のタスクでは非常に有効だが、戦略や計画といったタスクでは簡単には効果を発揮しない。例えば今回の試合で、OpenAIはpaiNよりも多いキル数を記録していた。試合の実況者たちは、完璧なタイミングで繰り出される組織的な攻撃に驚いていたほどだ。人間チームには抵抗不可能にも思える攻撃である。

しかし、戦略面ではボットが遅れをとっており、勝利に必要となるリソース収集と割当てで多くのチャンスを逃していた。

そんなボットの学習方法は、人間のアプローチとはだいぶ違う。人間の場合、ゲームの目的や有効な戦略の立て方を学ぶことで(幸運なことに)数百万試合をプレイせずとも初心者からプロゲーマーになることができる。

一方で強化学習を行ったボットは、少なくとも現在は高いレヴェルでゲームに参加できていない。ボットたちは一瞬一瞬の最適なアクションを予想することで動いているのだ。

「ボットたちはゲームに『反応』しています。ゲームの世界を見て、そのときに何をするかを考えるわけです」と、カリフォルニア大学バークレー校のベン・レヒト教授は言う。

OpenAIのDota 2プロジェクトでソフトウェアエンジニアを務めているスーザン・チャンは、対paiN戦でその欠点が現れたと話す。訓練中、ボットは自分のアクションの影響を最大14分先まで考えていた。「単純に、15分以上先のことを『計画する』メカニズムが備わっていないのです」と彼女は言う。「これは間違いなく、試合でボットが見せた長期戦略の欠如につながっています」

ボットたちは一瞬一瞬の身の振り方がとても上手だが、マクロレヴェルの意思決定が苦手なようだ。

 

 

コンピュータによる学習開始から約2時間で、公開されている将棋ソフトとしては最強とされる「elmo(エルモ)」を打破。チェスについても、約4時間で世界最強のプログラムに勝利。

 

局面数が10の360乗と桁違いに複雑な囲碁

アルファ碁ゼロ」は、AI同士の自己対戦だけで育てた。お手本として人間のデータを使っていない。
グーグルの豊富なコンピュータ資源を活用して、学習からわずか3日間で、人類のトッププロを超えるレベルに。


AlphaGo Zero はゼロから学習し

→3時間までは初心者

→10時間に基本定石を発見

→16時間に小ナダレ定石を学習

→19時間で死活、厚みと地の概念を学習

→24時間に小目の定石を学習

→36時間に星の定石を学習

→55時間に人類の理解を超える定石を発見

→72時間で恐ろしい強さに…

 

「三々入り」だけではなく、双方の石がぶつかり合って手抜きがしにくい接触戦のさなかに戦いを放置して他方面に転戦したり、「ツケ」「肩ツキ」と呼ばれる、今までの囲碁の定説をひっくり返した新手法をアルファ碁はたくさん示した。

到底生きることができなさそうな狭いところへ平気で打ち込んだり、定石っぽく進行したかと思えば、中途半端なところで手抜いて他の部分に浮気したり

 

アルファ碁ゼロは、学習開始からたった3日で人間の世界トップレベルを上回った。この学習には、グーグルが開発した機械学習に特化した超高性能の半導体「TPU」が2000個使われている。この計算量を市販のコンピュータを使って個人ベースで実行しようとすると数百年、小規模の研究室レベルでも数十年かかると試算されている。ディープマインドの技術力と、グーグルの莫大なリソースが合わさってこその成果と見ることもできる。誰でも簡単に、同じ規模の開発をできるわけではないのだ。

 

しかし、ムーアの法則より32年後のコンピュータの性能の現在のものと比較した倍率は、倍率p=2^(32/1.5)
=2642245.94963
∴32年後のコンピュータの性能は現在のものの約2642246倍になる予定。

 

色々な企業や研究者が、さらに効率のよいAIの仕組みを追求していますし、この人工知能を支えているディープラーニング(深層学習)のテクノロジーも進歩している。

 

現在、新薬1つあたりの研究開発費は1000億円を超え、開発期間は10年以上。

 

このようなAI創薬がもたらす経済効果として、現在は1品目あたり1000億円を超える研究開発費がかかっているが、仮に開発期間を4年短縮できたとすると、560億円まで削減できるという。

 

スーパーコンピューター「京」を用いたときは、約25万件の相互作用データを学習するのが精一杯だった。その後、2014年から2015年にかけてインテルXeon搭載サーバーで計算した結果、400万件までのデータの学習を実現した。さらには、それに付随して予測率の向上も見られたという。

ディープラーニングと候補となる化合物の表現方法の進歩による)

 

次世代のAI創薬においては疾患自体を入力すると、それに対応する新規の化合物を薬の候補を提案するようになるという。
自分で考えてドラッグデザインする人工知能を作るのが目標。

 

また、ライフインテリジェンスコンソ-シアム(Life Intelligence Consortium; LINC)が立ち上がった。これは、製薬のみならず、化学、食品、医療、ヘルスケア関連のライフサイエンス分野を広く扱い、2017年10月時点で、89の企業や機関が参画している。

 

ディープラーニングで化合物のスクリーニングを行うだけでなく、生成モデルを使って狙った特性を持つ候補化合物をいきなり生成してしまうような研究も出てきている。

化合物をそもそもニューラルネットワークに入力するのかという点については、化学構造をテキストで表現するSMILESという形式や、化合物の特徴を表すfingerprintと呼ばれる形式などがあります。記事にも出てきていますが、化学構造をグラフ構造と解釈して計算するgraph convolutionも注目を集めてきています。

 

アリババは「向こう3年で150億ドル(約1兆6900億円)のAI関連研究開発費」を予算化。世界に7つの研究所設立。桁違い。アリババ以外にも、バイドゥ、テンセントも桁違いの予算の掛け方。それに加えて各社とも、教育領域に関わらず多くのAI関連スタートアップに膨大な投資。

政府の同分野への莫大な投資も大きく影響。これからもっとこのような成果は出てくるでしょう。

 

創薬事業は多額の研究開発費を数少ないアタリ薬で回収する、ギャンブル的な要素が強いはずなので、AIによってその確率が高まる、もしくは開発スピードが上がれば、収益性も安定かつ高まる。

加えて、アルファ碁のように、人間の研究者が到底思いつかない化合物の組み合わせによる新薬も発明されることに期待

 

機械学習の飛躍的進展により、アルゴリズムが人間の「勘」を真似できるようになった。新薬や新材料の開発は、それこそ無限にある化合物の組み合わせを試す必要がある。ある程度は理論で絞れる。その先は偶然と研究者の「勘」に頼るところが大きい。

でも、熟練した研究者の勘とは超能力ではない。経験を通して身につけた、数式や言葉としては明示的にあらわらせないなんらかの指針です。(ヒューリスティックスといいます。)そのヒューリスティックスを学習し、それに基づいて次に試す化合物の組み合わせを決めれば、人間の勘のようなものを真似できます。

それと、こんな記事があると決まってシンギュラリティだとか研究者がいらなくなるという馬鹿馬鹿しいことを言い出す人がいそうなので先に言っておきます。そのようなことは少なくとも向こう数十年では起きないでしょう。ただし、研究者の役割は、自分の勘を使って試験管を振ることから、創薬アルゴリズムを設計することに変化していくでしょう。

 

コンピュータ自身が、自分より優れたコンピュータを作れるようになったら、あとはダーッとコンピュータは進化していくと思うんだよね、もう指数関数的つうか階乗的つうかのペースで。

 

クロック数も限界に来てるし
量子コンピューターがコンシューマー用に普及するく革新がないと
今後10年の変化はあまりないと思う

 

入力と出力の間のプログラムは全部人間がつなぐんだから、賢くなってるのは人間であってコンピュータじゃない。

 

AIは今の技術では力作業だから、お金を出し惜しみしない。どんなにお金を使ってでも、他より少しでも早く強いAIを作れれば、その時点でAI長者になれる。

 

たった一人に360億円を払って囲い込んだ例もある。プロスポーツと同じく、誰にもできないなら青天井で給与が出る。

 

AIは大した技術じゃない。仕組みは、ただの統計計算だ。しかし、人類最大のイノベーションなのだ。

 

毎秒1那由他回(=10^-8無量大数)ぐらいまで行ってほしい。冷却代節約のため北極に建てて、自らの存続を賭けて、地球温暖化をマネージする

 

資金調達は時間をお金で買うための手段と思いますが、42.5億円でどれくらいの時間が買えるのでしょうか。事業計画によって違いすぎるので単純計算できないのは重々承知の上で、なんかそういうのが計算できるソフトがないかなと思います。


そうすれば、自分たちが一体いくら調達すればいいのか、逆に今は調達できないことで何年分のロスになっているのかがわかれば、経営の大きな指針になるんですけどね。あるテストの点数分布が正規分布に近似できて、平均点50点・標準偏差10点だったのなら

40点から60点の間に受験者の約68%が存在し

30点から70点の間に受験者の約95%が存在する

ということです。この標準偏差の「68%95%ルール」、知っているとものすごく便利なんですよ。

なぜなら、データの総数が1000を超えた分布は、正規分布に近い分布になるケースが多いことが分かっているから。つまり、この標準偏差の「68%95%ルール」は身近にある様々なデータに活用できるのです。

「どの塾に行った方が良いか」や「電車とバスのどちらを使うべきか」、「どう勉強すれば最も合格率が高いか」さえも計算できる可能性を秘めている。

 

世界史は情報検索、数学は論理的な自然言語処理と数式処理で高得点の獲得を実現できたが、鬼門となったのは英語と国語。特に英語は難関で、150億文を記憶させても、ディープラーニング技術を取り入れても、スコアが伸び悩んだ。
著者によれば、「東ロボくん」が伸び悩んだ理由は、それが「計算機に過ぎない」ことにある。いくら速度と記憶量が上がったとしても、「AI」は「数式として表現できること―論理と確率と統計で表現できること―」以上のことは表現できない。つまり、その枠外にある「意味」を表現することができないのだ。人間であれば直感的に理解可能な「私はあなたが好きだ」と「私はカレーライスが好きだ」ということの本質的な意味の違いを数式で表現することは極めて難しく、そこに「AIができること」の限界があるのだと著者は説く。

 

過去の履歴だけでは、ワクワクするような

クリエイティブな提案には結びつかない。

 

ディープラーニングを活用したAIシステムは、ファッショントレンド、自社製品のランウェイ画像に対する消費者心理、流行パターン、シルエット、色、スタイルなどの分析に利用される見通しで、分析結果はデザイナーに伝えられ、次回コレクションの参考に使われる。言い換えれば、自社の意思決定を行う上で人工知能がリサーチャーの役割を果たすというわけだ。

 

主なスパコンの順位と計算速度(1秒間の浮動小数点計算回数、京は1兆の1万倍)は以下の通り。

(1)米オークリッジ国立研究所「サミット」 14京3500兆回

(2)米ローレンスリバモア国立研究所「シエラ」 9京4640兆回

(3)中国・無錫スパコンセンター「神威太湖之光」 9京3014兆回

 

本件の情報源は確認していませんが、この手の情報の出元は、多くの場合に、予算獲得をしたい側であることが多いのは、認識しておく必要がありましょう。数字は集計方法で作れてしまいます。そして、我が国は他国に予算で遅れを取っているので、もっと予算を掛けましょうというという論理を展開する場合が多いのです。このバイアスの可能性は、冷静にみる必要がありましょう。

 また大事なのは、今がアクセルを踏むべきタイミングか、ということです。即ち、今お金を掛けるのがいいことか、悪いことかということです。早くお金を掛けすぎると、その後に息切れし、技術的な環境が整った頃には、予算がつけられないということも歴史的には、多々起きています。有名なのは、第5世代コンピュータのプロジェクトがあげられます。私の会社でもそういう経験がいくつもあります。量子コンピュータは、まだ、実用的な可能性が全く見えていない基礎研究の段階です。ある程度お金をかけることは必要です。しかし、その上記のタイミングの判断と見極めが重要になります。周りがやっているから、というのはこれまでの経験上あてになりません。

 日本は、全般には、未来への投資を躊躇する国になっていることは間違いなく、それは変えなければなりません。もっと未来に投資すべきです。これは断言したいです。しかし、投資戦略としては、皆がやっているから、というのは最悪の戦略です。もっと日本独自の投資が必要だと考えます。ただでさえ、このようなハードウエア関連の箱物は、それでも予算化しやすいのです。日本の弱体化の大きな原因は、ソフトウエアやデータ関連に全く投資が動いていないということです。それは、従来のハードウエアで成功体験を持つ人たちが、投資権限に影響を持つ社会ネットワークのポジションに沢山いるからです。構造的にはもっと難しい状況があります。企業で、産業的に成り立たなくなった分野の人(ハードウエアが多い)が、大学に出て、国の予算を獲得しようとするので、国の予算の配分が、過去の産業分野へバイアスしてしまうという問題があります。未来を見れない構造があるのです。このような課題を前向きに未来に向けて、我々の手で変えていく必要があります。