和風ましらに

機械学習とか勉強したことを書き認めるブログ

前処理

カテゴリ変数の取り扱い方法

都道府県の名称など、値自体に意味が無い変数を扱う場合は、そのまま機械学習にかけてしまうと意味不明な結果が出る。 図1 都道府県と目的変数 そこで、よく使うカテゴリ変数の対処方法をまとめた。 ダミー変数化 変数を各種類ごとのカラムに分けて、0,1表記…