和風ましらに

機械学習とか勉強したことを書き認めるブログ

Seabornによるグラフの作成 ~相関関係の可視化~

前回に引き続き、seabornの中の関数について、自分のメモがてら紹介していきます。 今回は相関関係の可視化を中心に取り扱います。

import seaborn as sns
import pandas as pd

df = sns.load_dataset("iris")  #データ準備
df['test'] = df['petal_length'] > 3.5
df.head()
   sepal_length    sepal_width petal_length    petal_width species test
0  5.1    3.5    1.4    0.2    setosa  False
1  4.9    3.0    1.4    0.2    setosa  False
2  4.7    3.2    1.3    0.2    setosa  False
3  4.6    3.1    1.5    0.2    setosa  False
4  5.0    3.6    1.4    0.2    setosa  False

jointplot関数

二変数間の相関を見る時に使います。使い方は分かりやすく、相関をみたい2つの変数を引数に入れて、kindに'reg'を指定してあげると見れます。

sns.jointplot(df.sepal_length, df.sepal_width, kind="reg")

jointplot

pairplot関数

各変数の散布図を作成することができる。第一引数に元データを入れてあげて、カテゴリごとの違いをみたいなら引数hueに変数を入れてあげる。

sns.pairplot(df, hue="species")

pairplot

heatmap関数

各変数間の相関の強さをヒートマップにして可視化することができる。 pd.corr()は数値の列のみが対象で、欠損値NaNは除外して算出される。

sns.heatmap(df.corr(), square=True)

heatmap