오경석의 개발노트

Python_결측치 처리 본문

프로그래밍 언어/Python

Python_결측치 처리

OHSAYU 2022. 9. 8. 09:58

결측치(Null) : 값이 존재하지 않고 비어있는것

유효하지 않는 값(NaN, Not a Number) : 주어진 값이 유효하지 않는것


결측치(Null) or 유효하지 않는 값(NaN) 확인

df['column_name'].isnull()
df['column_name'].isna()
df['column_name'].notnull()
df['column_name'].notna()

결측치를 특정 값으로 채우기

df.fillna()

결측치를 변수별 평균으로 대체하기

df.fillna(df.mean(), df.where(pd.notnull(df), df.mean(), axis='columns')

특정 컬럼이 결측치인 행 제거

df.dropna(subset=['column_name'])

결측치가 들어있는 행 전체 삭제

df.dropna(axis=0)

결측치가 들어있는 열 전체 삭제

df.dropna(axis=1)

특정 행 또는 열을 대상으로 결측치가 들어있으면 제거

df['column_name'].dropna()

결측치 값을 앞(fill), 뒤(bfill) 행 값으로 채우기

df.fillna(method='bfill')
df.fillna(method='bfill')
Comments