科学研究の手法は、これまでいくつかのパラダイムシフトを経て発展してきました。1つ目のパラダイムが実験や観測に基づく経験的手法、2つ目が自然現象の定式化による理論的手法、3つ目がコンピュータシミュレーションを駆使する計算科学的手法です。そして、近年、再びパラダイムシフトが起こり、第4の手法が確立されつつあります。それが、機械学習や人工知能(AI)を用いるデータ駆動型の手法です。

実際に、これらの手法が研究の現場でどう使われているかを説明するために、発光材料の開発プロセスに注目してみましょう。図1(左)のテルビウム(Tb)化合物は、緑色の発光を示しますが、その強度は微弱です。ここから、強い発光を示す化合物を開発するには何から始めるのが良いでしょうか?一つ目の方法は、Tbのまわりの分子(配位子と呼びます)を少しずつ変えた化合物を合成してみるというやり方です。でも、どこを変えるのがゴールへの近道か分からない状態で闇雲に実験を繰り返すのは、なかなか大変です。(ただし、このような実験の繰り返しの中から思いもよらぬ成果が得られたりするので、実験の繰り返しはとても大切です。)次に、発光の強さを決める要因に着目します。分子が光を吸収することでエネルギーを得た後、そのエネルギーを光または熱として放出します。前者は発光、後者は熱失活と言います。理論研究の積み重ねから、発光の起こりやすさが配位子にあまり依存しないのに対し、熱失活の起こりやさすは配位子によって大きく変化することが分かっています。つまり、発光強度を制御するには、熱失活の起こりやすさを制御すれば良いわけです。ここまで来たら、次は計算科学の出番です。失活過程における構造やエネルギーの変化を、コンピュータを用いて計算します。その結果、図1(右)に示す通り、C=N二重結合部分の面外変角振動が熱失活の原因となっていることが分かりました。実際に、C=N二重結合部分を単結合に置き換えるだけで、発光強度が著しく向上することが確認されています。

図1 Tb錯体(左)と失活過程における構造変化(右)

ここまでのお話から、第1~3の研究手法だけで十分だと感じるかもしれませんが、上記のような理想的なケースは稀です。実際には、複数の要因が複雑に絡み合っていて理論的説明ができないケースや、現存のコンピュータシミュレーションで精度よく計算できないケースも多々あります。ここで、大きな力を発揮すると期待されているのが、第4のパラダイム-データ駆動型の研究手法-です。データ駆動型の研究手法では、材料の情報を説明変数x、材料の機能や性質を目的変数yとし、多数の材料のデータセット(x, y)を用いて、機械学習モデルy = f(x)を構築します。一度、モデルfが出来てしまえば、未実験の材料に対するxを入力することで、その機能・性質yを推定することができます。つまり、メカニズムが分からなかったり、シミュレーションができなかったりしたとしても、コンピュータ内での材料スクリーニングが可能になるわけです。この戦略の成功の可否は、①材料をどう数値で表現するかと②材料のデータをどう集めるかにかかっています。①の問題については、これまで理論科学・計算科学の中で培われてきた知見や技術を活かした方法論の提案が相次いでいます。②の問題を解決するために注目を集めているのが、ロボットによる自動実験です。産業技術総合研究所の「まほろ」をはじめとし、科学の様々な分野にロボットの進出がはじまっています。私が学生のころは、科学の研究にAIやロボットの知識が必要になる日がくるとは予想していませんでした。さらに、計算科学の世界でも、量子コンピュータによるパラダイムシフトが起ころうとしています。科学のパラダイムの転換期に立ち会えていることは、科学者としての最上の喜びです。最先端の研究をキャッチアップするために必要な知識が突然増えて、四苦八苦していますが、これをチャンスと捉え、新しい科学を目いっぱい楽しみたいと思っています。

ナビゲーションの始まり