機械学習アルゴリズム
機械学習で用いられているパラメーター学習法である、最急降下法とニュートン法について整理。 基本的には、こちらの文章を参考にさせていただきました。 https://brage.bibsys.no/xmlui/bitstream/handle/11250/2433761/16128_FULLTEXT.pdf 書いていて面倒…
勾配ブースティングについて、ざくっと整理。 アルゴリズムの基本原理は、 「構築した学習器まででの予想値と実測値の残差(勾配)を次の学習器で学習する。」 目的変数が二乗誤差の場合は、 実測値と予測値の差分が、次の学習器での学習対象となります。 な…
「生命情報向けの機械学習入門」という内容で、生物×機械学習という分野でコンテンツを作られている方のgitを見つけて色々触ってみたので、書き留めておきます。 github.com 「4章 : 配列を解析する深層学習」という内容を触ってみました。 内容としては、以…
モデルを作った後、説明する際に 「ここら辺の特徴量が効いてます。」 的なことを言わないといけない。 そこで、変数重要度をよく使う。 ランダムフォレストやXGboostでの変数の重要度評価をメモがてらまとめてみた。 RandomForestを活用した変数重要度評価 …
やったこと 小麦の遺伝子の情報から表現型を予測するという論文を読んでみました。 DeepGS: Predicting phenotypes from genotypes using Deep Learning という論文です。twitterでいい感じの論文ないかなと思って探してたら、ちょうどいいのを見つけました…
LightGBMとは、2017年にMicrosoftから出された機械学習アルゴリズム。 こちらの論文に詳細は記載されている。 論文中では、LightGBMのことを以下のように紹介してる We call our new GBDT implementation with GOSS and EFB LightGBM.Our experiments on mul…