講演者

材料・物質研究開発の新手法として期待されているマテリアルズ・インフォマティクス。その現状と将来について、日米から気鋭の研究者、ダム准教授(北陸先端科学技術大学院大学)とVoorhees教授(Northwestern University)のお2人にご講演いただきます。
(※本プログラムの同時通訳はありません。)

招待講演1 (日本語講演)

10月21日(金)10:15~11:00(45分)
これまで分光・構造解析実験や電子状態計算、データ科学といった複数の分野に渡って研究してこられたDam准教授に、データマイニング手法についてご講演いただきます。
近年では、希土類磁石の開発に関連して、希土類を含む強磁性遷移金属化合物のキュリー温度の機械学習的な予測でも大変興味深い研究をされています。
北陸先端科学技術大学院大学 准教授
材料物性へのデータマイニング手法の適用の現状と展望
望みの物性や機能を持つ物質や材料の開発は、物質・材料研究における基盤的な目標の一つである。これまでのところ、そうした開発を可能とする方法は確立されておらず、「膨大な試み」、経験に基づく「ひらめき」とか「勘」、それに「偶然」などの産物として、驚くべく多様で、しばしば驚異の目で見るような新物質・新材料が開発されてきた。しかし、科学・技術のこれほどまでの高度化に伴い、従来のやり方で、新物質・新材料の開発を続けていくことが困難になりつつあり、より系統的で、かつ効率的・網羅的な方法が必要になってきている。同時にまた、物質・材料が多様化し高度化するにつれ、それらの物性や機能の理解そのものも困難になりつつあり、理解のためのヒントを与えてくれる新しい方法もまた望まれている。

これらの要望に応える可能性を持つものとして、マテリアルズ・インフォマティクス(MI)が登場した。MIの基盤技術の一つはデータマイニングと考えられる。データマイニングは機械学習手法を活用してデータを使って学習し、その学習で得られた知識を使って、データが内包する特徴を抽出し、未知のデータに適用して予測をすることを狙っている。物質のデータから効率的に学習するには、各物質のデータを識別できるように物質を記述する属性・記述子を適切に設計しないといけないだけでなく、その属性・記述子を基にした物質同士を定量的に比較する方式も提案する必要がある。材料科学の研究には物質の構造と物性が最も大事な情報であるが、物質の物性を記述するには従来の記述方法ででも物質同士を定量的に比較することがある程度できる。一方、物質の構造を記述するには全原子の座標を記述すればすべての情報が含まれるにも関わらず、そのままの記述方法では物質同士を定量的に比較することができない。また、物質の構造と物性値を合わせて記述しようとすると、膨大な属性・記述子が必要になり、物質空間を表現するためには非常な高次元のデータが必要となる。さらに、これらの属性・記述子を基にすると、研究者の直感的行為である思索や試行錯誤が追いつかなくなる恐れがある。そのため最先端のデータマイニング技術と高性能コンピューティングを活用して、大量のデータから学習するアプローチが期待される。

一方、物質は一般的な物理法則に従うだけでなく、それぞれの物質群はそれぞれに共通な特色を持ち、共通な法則に従う。それらの共通な特色と法則はマテリアルサイエンティストが探すものである。ここで、特色や法則の存在は属性・記述子同士がお互いに完全に独立でないことを意味する。数学的なイメージでは高次元空間における各物質のデータが低次元超局面に乗っていることになる。そのため、物質の高次元データを次元削減できることが暗黙的に法則を見つけることと等価である。近年、高次元データから現象の本質を低次元で抽出するスパースモデリングという技術がトレンドとなっている。そのなか、正則化を加えた線形・非線形回帰解析によるスパース性の学習・重要な記述子を識別選択する方法が非常に有効である。これらの手法を用いた各記述子の網羅的な関係性を構築することによって、データの背後にある本質的な構造を抽出ことができ、それを用いて因果関係を議論することに近づくことができ、マテリアルサイエンスにおいてはデータ駆動型の材料設計への道が開かれる。本講演ではこの観点で材料物性の研究におけるデータマイニング手法の適用の現状と展望を紹介したい。

招待講演2 (英語講演)

10月21日(金)13:30~14:30(60分)
米国オバマ政権が推進しているMaterials Genome Initiative(MGI)の中心人物であり、Center for Hierarchical Materials Design(ChiMad)の責任者であるDr. Voorheesに、米国における最新のMaterials Informaticsの現状についてお話いただきます。是非生の声でお聞きください。
Peter Voorhees (経歴)
フランク C. エンゲルハート教授
ノースウェスタン大学(米) 教授
マテリアルズ・インフォマティクス:データマイニング、インフラストラクチャー及び合金の設計
Materials data lies at the core of any materials development effort. It provides the foundation for the models that are used to compute the properties and structure of materials, and can be used to identify new compounds with novel properties. A classic example is the central role played by CALPHAD free energy functions in simulations of microstructural evolution in hierarchical materials. Another is identifying compounds with unique properties through mining databases created by density functional calculations. However, challenges remain. In many cases it is unclear how to share data and discover existing databases. While many materials databases exist, their long-term sustainability is often unclear. In addition, there is no community-wide consensus on the proper metadata for a given dataset. I will discuss our efforts in data mining, a proposal for a world-wide federated system of materials databases, an approach to handling large materials data, and methods for creating schemas for materials data.