SHAP

IT

機械学習における変数選択手法:BorutaShapを試してみた

機械学習による回帰性能を向上させるためには、説明変数(特徴量)を適切に選択する必要がある。これを自動化したライブラリとしてBorutaが知られている。今回、Borutaのアルゴリズムを用いてShapley Valueで説明変数を選択するBorutaShapというライブラリが公開されているため、試してみた。使う上で幾つか修正が必要であった。動かした感想としてはBorutaよりも少し優秀かもしれない、しかし計算時間はBorutaよりも掛かる、という結果であった。説明変数の数が少ないと計算時間が気にならないので有効かもしれない。
IT

機械学習における説明変数の選択(2)

機械学習における説明変数の選択にSHAPを使用してみた。SHAPは通常説明変数の寄与度を表すために使用されることが多いが、重要度の大きいものを選択することができる。Borutaと組合せて使用して、今回のアヤメのデータでは残念ながら大きな効果は得られなかった。
IT

機械学習における説明変数の選択(1)

機械学習において目的変数と説明変数より妥当なモデルを作成する。このとき説明変数を多く集めてその中から有効なものを選択する必要がある。その方法としてBorutaが提案されている。今回これに加えてSHAPで変数選択する方法を考えてみた。