10月から縁あってMaterials Infomaticsが主たる業務となった。Materials Infomaticsとは情報工学、いわゆるITあるいはAIを活用して新しい材料を開発する分野である。現在色々と勉強中で、今後備忘の意味も含めてまとめていきたい。
AI、機械学習を用いて新しい材料を開発するとは具体的にどういうことをやるのかというと、まずは材料の特性を評価した実験データが必要になる。特性は何でもよいが、例えばコンクリートの圧縮強度とすると、今回の目的はより優れた圧縮強度を持つコンクリートの開発、となる。このためにはコンクリートの成分、製造条件と圧縮強度のデータが必要となる。次に実験データを用いて目的とする特性(この場合は圧縮強度)とそれを支配するであろう製造条件、コンクリートの組成等の関係を回帰分析を用いて解析する。ここで、目的とする特性を目的変数、様々な因子を説明変数と呼ぶ。この回帰分析のところで現在は色々な回帰分析手法が提案されており、機械学習を活用することになる。この部分は既にPythonのライブラリが提供されており、下のPycaratのように自動的に10個以上の回帰分析を自動で行ってくれるものもある。

回帰分析により、目的変数と説明変数の関係が得られる。どの位うまく表現できているかについては、統計的な評価によりR2(決定係数)やMAE(平均絶対誤差)の数字で評価する。こうしてうまく目的変数を予測できる回帰分析手法が決まれば、次に逆解析を行う。
通常は説明変数(コンクリートの製造条件等)から目的変数(圧縮強度)を計算するのであるが、今回優れた圧縮強度の得られるコンクリートを開発することが目標であるため、本当は目的変数(圧縮強度)から説明変数(コンクリートの組成や製造条件)を求めたい。このため、コンピュータ上で沢山の仮想的な説明変数を発生させてこれらから目的変数を計算する。これを逆解析と呼ぶ。この時にコンピュータ上の仮想データのデータ範囲として実験データよりも少し範囲を広げてやる。例えばコンクリートの焼成温度の範囲を実験データよりも少し外側まで膨らませるようなことをする。そうすると目的変数のばらつきは大きくなり、中には大きな圧縮強度を持つものも出てくる。その時の説明変数、つまりコンクリートの組成や製造条件はわかっているため、今度はこれらを用いて実際に実験をする。その結果が本当に高い圧縮強度になるのであれば、それで終わり、高い圧縮強度が得られなければ、今度はそれらのデータも含めて再度回帰分析を行っていく、という流れとなる。
このような手法は適応的実験計画法とも呼ばれている。既存のデータを用いてより優れた特性を持つ可能性のある条件を効率的に探索できる手法であり、その意味は大きいと思われる。下はこの適応的実験計画法について記載された書籍となる。
#MaterialsInfomatics #適応的実験計画法 #機械学習

コメント