프로그래밍 언어/Python
Python_결측치 처리
OHSAYU
2022. 9. 8. 09:58
결측치(Null) : 값이 존재하지 않고 비어있는것
유효하지 않는 값(NaN, Not a Number) : 주어진 값이 유효하지 않는것
결측치(Null) or 유효하지 않는 값(NaN) 확인
df['column_name'].isnull()
df['column_name'].isna()
df['column_name'].notnull()
df['column_name'].notna()
결측치를 특정 값으로 채우기
df.fillna()
결측치를 변수별 평균으로 대체하기
df.fillna(df.mean(), df.where(pd.notnull(df), df.mean(), axis='columns')
특정 컬럼이 결측치인 행 제거
df.dropna(subset=['column_name'])
결측치가 들어있는 행 전체 삭제
df.dropna(axis=0)
결측치가 들어있는 열 전체 삭제
df.dropna(axis=1)
특정 행 또는 열을 대상으로 결측치가 들어있으면 제거
df['column_name'].dropna()
결측치 값을 앞(fill), 뒤(bfill) 행 값으로 채우기
df.fillna(method='bfill')
df.fillna(method='bfill')