和風ましらに

機械学習とか勉強したことを書き認めるブログ

2019-01-12から1日間の記事一覧

「生命情報向けの機械学習」を触ってみた

「生命情報向けの機械学習入門」という内容で、生物×機械学習という分野でコンテンツを作られている方のgitを見つけて色々触ってみたので、書き留めておきます。 github.com 「4章 : 配列を解析する深層学習」という内容を触ってみました。 内容としては、以…

カテゴリ変数の取り扱い方法

都道府県の名称など、値自体に意味が無い変数を扱う場合は、そのまま機械学習にかけてしまうと意味不明な結果が出る。 図1 都道府県と目的変数 そこで、よく使うカテゴリ変数の対処方法をまとめた。 ダミー変数化 変数を各種類ごとのカラムに分けて、0,1表記…

機械学習を活用した変数重要度評価

モデルを作った後、説明する際に 「ここら辺の特徴量が効いてます。」 的なことを言わないといけない。 そこで、変数重要度をよく使う。 ランダムフォレストやXGboostでの変数の重要度評価をメモがてらまとめてみた。 RandomForestを活用した変数重要度評価 …