ホーム » 技術 » Machine Learning » 3次元結晶構造に基づく材料の物性予測についてICMLA2023で発表しました

SAKURA Internet Inc.

アーカイブ

3次元結晶構造に基づく材料の物性予測についてICMLA2023で発表しました

さくらインターネット研究所の鶴田(@tsurubee3)です。2023年12月15〜17日にアメリカ合衆国フロリダ州ジャクソンビルで開催された22nd International Conference on Machine Learning and Applications (ICMLA 2023)にて、「DeepCrysTet: A Deep Learning Approach Using Tetrahedral Mesh for Predicting Properties of Crystalline Materials」と題した研究について発表しました。
この研究は、マテリアルズ・インフォマティクスと呼ばれる材料科学と情報科学の融合分野における研究です。これまでさくらインターネット研究所では、ITインフラが主な研究開発の対象分野でしたが、最近では、大学や企業と連携しながら材料科学や創薬などの自然科学分野の研究開発にも積極的に取り組んでいます。今回の研究発表は、以前のプレスリリースでもご紹介した京都大学複合原子力科学研究所と共同で取り組んだ成果です。

DeepCrysTet: A Deep Learning Approach Using Tetrahedral Mesh for Predicting Properties of Crystalline Materials

鶴田博文1, 桂ゆかり2,3,4, 熊谷将也1,4,5 [論文] [Code]
1. さくらインターネット株式会社 2. 物質・材料研究機構 3. 東京大学 4. 理化学研究所 5. 京都大学

発表概要

所望の物性を持つ新規材料の探索を加速するために、機械学習(以下、ML)技術を用いて材料物性を予測する研究が盛んに行われています。金属やセラミックなどの無機材料は、材料内部の結晶構造が物性に大きく影響を与えることが知られているため、これまでに材料の結晶構造の情報を活用して物性を予測するML手法が提案されています。この際、結晶構造の情報をどのように特徴量に変換し、MLモデルに入力するかが重要です。
現在の主流なアプローチは、結晶構造をグラフに変換し、グラフニューラルネットワーク(GNN)を用いて物性を予測する手法です。代表的な先行手法としてCrystal Graph Convolutional Neural Networks(CGCNN)やAtomistic Line Graph Neural Network (ALIGNN)があり、様々な物性において非常に高い予測精度を実現しています。しかし、結晶構造は本来3次元の情報であるため、グラフに変換することで原子位置などの3次元情報の一部が失われることになります。そのため、結晶構造の3次元情報を活用したデータの表現方法やMLモデルを設計することで、さらに物性予測の精度を高められるのではないかと考えました。
本研究では、コンピュータグラフィックスなどの分野で広く利用されているドロネー四面体分割を結晶構造に適用し、材料の結晶構造を3次元メッシュで表現することに着目しました。また、3次元メッシュを用いて材料物性を予測する深層学習モデルを独自に設計しました。Materials Projectというオープンデータセットを用いた実験結果から、提案手法は結晶構造の分類において既存のGNNモデルを大幅に上回り、弾性的な物性の予測においてSOTA性能を達成することが示されました。

スライド

ICMLA2023

ICMLAは、Association for Machine Learning and Applications (AMLA)が複数の大学と連携して毎年開催している機械学習の応用に重点を置いた国際会議です。本会議では、幅広い分野の課題解決のための機械学習技術や、機械学習に関連した学際的な研究についての論文投稿が推奨されています。
ICMLA2023は、2023年12月15〜17日の3日間に渡り、アメリカ合衆国フロリダ州のHyatt Regency Jacksonville Riverfrontというホテルで開催されました。以下の写真のような会場が3つ並列で、終日プレゼンテーションが行われていました。

参加を終えての感想

ICMLAは学会名に「Applications」と掲げているだけあって、多様なドメインにおけるMLの応用に関する研究発表がありました。私自身は、理論やアルゴリズム・モデルの設計よりも応用の方に強い興味があるため、非常に楽しく発表を聞くことができました。その中でも、「Biology Applications」や「Space Applications」といった自然科学分野におけるML応用にフォーカスしたセッションが大変興味深かったです。一方で、私の観測範囲では、材料科学分野における研究は私の発表以外では見つけられませんでした。
自身の発表では、「学習したモデルが未知の材料に対してどれだけ適用できるのか」という質問をいただきました。新規材料の開発を目的とした場合、学習データに含まれるような観測済みの材料に対する予測性能よりも、未知の材料に対して、時間やコストがかかる実験をせずに計算機上で物性を予測できることが重要です。今回の研究における実験では、データセットをランダムに分割してモデルの性能評価のためのテストセットを作成しているため、今後の研究では未知材料への汎化性能を評価できるような実験の設計を検討していきたいと思いました。今回の経験を活かして、引き続き研究活動を進めていきたいと思います。