PoLyInfoは、高分子材料研究における数少ない包括的なオープンデータベースの一つです。その応用 範囲は広く、データ駆動型研究においてPoLyInfoは非常に有用なデータ資源です。しかしながら、PoLyInfo単体でできることに限りがあるのも事実です。そこで本セミナーでは、PoLyInfoを中心に外部データベースやラボで得られた限られた実験データの統合解析の手法、特に転移学習やマルチタスク学習について解説します。材料研究の多くのドメインでは、データ駆動型研究に必要な十分な量のデータを蓄積することが難しいのが現状です。この傾向は、特に材料研究の先端領域において顕著です。そこで計算機実験やPoLyInfoの包括的なデータを用いて事前学習モデルを構築し、目標ドメインの限られたデータを用いて追加学習を行うことにより、モデルに新たな知識を付与します。このとき、事前学習用のデータの増大が、目標ドメインのモデル性能にスケールするようにワークフローを設計することが求められます(転移学習のスケーリング則)。データ駆動型材料研究の目的は、このようにスケーラブルな転移を実現するためのデータ生産プロトコルや、解析ワークフローを構築することにあります。本セミナーでは、PoLyInfoを用いた液晶高分子の設計・制御や高分子相溶性予測を例に挙げながら、転移学習のスケーリング則の重要性や応用方法について解説します。
【参考論文】
[1] Wu, S., Kondo, Y., Kakimoto, M., Yang, B., Yamada, H., Kuwajima, I., Lambard, G., Hongo, K., Xu, Y., Shiomi, J., Schick, C., Morikawa, J., Yoshida, R.
Machine-learning-assisted discovery of polymers with high thermal conductivity using a molecular design algorithm. npj Computational Materials 5(1), 66 (2019).
[2] Yamada, H., Liu, C., Wu, S., Koyama, Y., Ju, S., Shiomi, J., Morikawa, J., Yoshida, R.
Predicting materials properties with little data using shotgun transfer learning. ACS Central Science 5(10), 1717-1730 (2019).
[3] Hayashi, Y., Shiomi, J., Morikawa, J., Yoshida, R.
RadonPy: automated physical property calculation using all-atom classical molecular dynamics simulations for polymer informatics. npj Computational Materials 8(1), 222 (2022).
[4] Minami, S., Hayashi, Y., Wu, S., Fukumizu, K., Sugisawa, H., Ishii, M., Kuwajima, I., Shiratori, K., Yoshida, R.
Scaling law of Sim2Real transfer learning in expanding computational materials databases for real-world predictions. arXiv, arXiv:2408.04042 (2024).
[5] Maeda, H., Wu, S., Marui, R., Yoshida, E., Hatakeyama-Sato, K., Nabae, Y., Nakagawa, S., Ryu, M., Ishige, R., Noguchi, Y., Hayashi, Y., Ishii, M., Kuwajima, I., Jiang, F., Vu, X.T., Ingebrandt, S., Tokita, M., Morikawa, J., Yoshida, R., Hayakawa, T.
Discovery of liquid crystalline polymers with high thermal conductivity using machine learning. ChemRxiv (2024).