일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- csharp
- RFP
- MariaDB
- Oracle VM VirtualBox
- it용어
- dbeaver
- C#
- 코딩테스트
- linux
- tibero
- Oracle
- 리눅스
- it 용어
- Python 라이브러리
- 파이썬 데이터프레임
- 파이썬 알고리즘
- Python DataFrame
- 알고리즘
- 파이썬
- 파이썬 전처리
- HTML
- sql
- 오라클
- python algorithm
- 데이터베이스
- VirtualBox
- Algorithm
- 리눅스 명령어
- putty
- PYTHON
- Today
- Total
목록Python DataFrame (4)
오경석의 개발노트

1. DataFrame 붙이기 : pd.concat() pd.concat()는 DataFrame을 말 그대로 물리적으로 이어 붙인다. concat() for combining DataFrames across rows or columns 해당 method의 옵션들은 다음과 같다. pd.concat(objs, # Series, DataFrame, Panel object axis=0, # default(행방향), 1 : 열방향 join='outer', # default, 'inner' ignore_index=False, default(기존 index 유지), True : 기존 index 무시 keys=None, 계층적 index 사용하려면 keys 튜플 입력 levels=None, names=None, # i..

# DataFrame type 확인 type(df) # DataFrame 각 컬럼별 data type 확인 df.dtypes # DataFrame data type 변경 df = df.astype('string or int or float') df['column_name'] = df['column_name'].astype('string or int or float') # 하나의 컬럼 data type만 변경

# 하나의 특정 조건과 일치하는 행 추출 df[df['column_name'] == 'value'] # 두개의 특정 조건과 일치하는 행 추출 df['column_name'][df['column_name'] == 'value'] # Series 출력 df['column_name'][df['column_name'] == 'value'][0] # Series가 아닌 해당 값만 출력

DataFrame 생성 데이터프레임을 만드는 방법은 다양하다. 가장 간단한 방법은 다음과 같다. 우선 하나의 열이 되는 데이터를 리스트나 일차원 배열을 준비한다. 이 각각의 열에 대한 이름(라벨)을 키로 가지는 딕셔너리를 만든다. 이 데이터를 DataFrame 클래스 생성자에 넣는다. 동시에 열 방향 인덱스는 columns 인수로, 행 방향 인덱스는 index 인수로 지정한다. data = { "2015": [9904312, 3448737, 2890451, 2466052], "2010": [9631482, 3393191, 2632035, 2431774], "2005": [9762546, 3512547, 2517680, 2456016], "2000": [9853972, 3655437, 2466338, 24..