Seabornによるグラフの作成 ~相関関係の可視化~
前回に引き続き、seabornの中の関数について、自分のメモがてら紹介していきます。 今回は相関関係の可視化を中心に取り扱います。
import seaborn as sns import pandas as pd df = sns.load_dataset("iris") #データ準備 df['test'] = df['petal_length'] > 3.5 df.head()
sepal_length sepal_width petal_length petal_width species test 0 5.1 3.5 1.4 0.2 setosa False 1 4.9 3.0 1.4 0.2 setosa False 2 4.7 3.2 1.3 0.2 setosa False 3 4.6 3.1 1.5 0.2 setosa False 4 5.0 3.6 1.4 0.2 setosa False
jointplot関数
二変数間の相関を見る時に使います。使い方は分かりやすく、相関をみたい2つの変数を引数に入れて、kindに'reg'を指定してあげると見れます。
sns.jointplot(df.sepal_length, df.sepal_width, kind="reg")
pairplot関数
各変数の散布図を作成することができる。第一引数に元データを入れてあげて、カテゴリごとの違いをみたいなら引数hueに変数を入れてあげる。
sns.pairplot(df, hue="species")
heatmap関数
各変数間の相関の強さをヒートマップにして可視化することができる。 pd.corr()は数値の列のみが対象で、欠損値NaNは除外して算出される。
sns.heatmap(df.corr(), square=True)