英国でデータサイエンスを学ぶ

30代になってから海外で統計学・機械学習・プログラミングを勉強

MENU

備忘メモ 欠損値処理

df.count()



欠損ち確認


df.isnull()

でこれでデータフレーム全要素を対象にしてしまう

列方向で見たければ
df.isnull().any(axis=0)

行方向で見たければ
df.isnull().any(axis=1)



欠損ちの個数
df.isnull().sum(axis=0)
df.isnull().sum(axis=1)




df.dropna() 欠損値がひとつでも含まれていたら、行を落とす
df.dropna(how='all') すべての値が欠損していたら、行を落とす
df.fillna(0) 欠損値を0で埋める
df.fillna(method='ffill') 前の値で欠損値を埋める