和風ましらに

機械学習とか勉強したことを書き認めるブログ

Pandas関数について -値の並び替え・削除

前回まとめた関数以外に、よく使う関数の一覧

nissyl.hatenablog.com

値の並び替え

sort_values関数

DataFrame内のカラムの値に基づいて、並び順をソートする。 defaultは昇順。降順にする場合は、"ascending = False"にする。

(例) df.sort_values('petal_length' ,ascending = False) # petal_lengthの値が大きい順に並べる

query関数

SQLのWhere文のようなイメージでDataFrameを操作することができる。

(例) df.query('petal_length > 0.5') #0.5以上のものだけを選択

reset_index関数

値を並べ替えたり、削除したりした際にインデックスを並べ替える時に、使う関数。

(例) df.sort_values('petal_length' ,ascending = False).reset_index(drop=True)  # 降順に並べ替えた形でindexを振り直す

列の選択・削除

iloc/loc関数

DataFrameの行や列を指定する関数。 locは名称で指定することができる ilocはインデックスで(順番)で指定することができる

(例)
df = df.loc[:,'petal_length'] #petal_length列のみ選択
df = df.iloc[:,2] #3列目のみ選択

drop関数

列や行を削除することができる関数。 列を削除する場合は引数axisに1を指定してあげる。

(例) df.drop('petal_length' ,axis = 1)