일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 파이썬
- Python DataFrame
- it 용어
- MariaDB
- putty
- dbeaver
- HTML
- it용어
- 리눅스
- python algorithm
- Oracle VM VirtualBox
- 파이썬 데이터프레임
- 리눅스 명령어
- 코딩테스트
- C#
- 데이터베이스
- 알고리즘
- Algorithm
- Oracle
- 파이썬 알고리즘
- csharp
- sql
- linux
- Python 라이브러리
- PYTHON
- VirtualBox
- 파이썬 전처리
- tibero
- RFP
- 오라클
- Today
- Total
목록파이썬 전처리 (3)
오경석의 개발노트

# 하나의 특정 조건과 일치하는 행 추출 df[df['column_name'] == 'value'] # 두개의 특정 조건과 일치하는 행 추출 df['column_name'][df['column_name'] == 'value'] # Series 출력 df['column_name'][df['column_name'] == 'value'][0] # Series가 아닌 해당 값만 출력

loc, iloc 차이 loc(location)는 데이터프레임의 행이나 컬럼에 label이나 boolean array로 접근 iloc(integer location)는 데이터프레임의 행이나 컬럼에 인덱스 값으로 접근 data = { "2015": [9904312, 3448737, 2890451, 2466052], "2010": [9631482, 3393191, 2632035, 2431774], "2005": [9762546, 3512547, 2517680, 2456016], "2000": [9853972, 3655437, 2466338, 2473990], "지역": ["수도권", "경상권", "수도권", "경상권"], "2010-2015 증가율": [0.0283, 0.0163, 0.0982, 0.0141..

DataFrame 생성 데이터프레임을 만드는 방법은 다양하다. 가장 간단한 방법은 다음과 같다. 우선 하나의 열이 되는 데이터를 리스트나 일차원 배열을 준비한다. 이 각각의 열에 대한 이름(라벨)을 키로 가지는 딕셔너리를 만든다. 이 데이터를 DataFrame 클래스 생성자에 넣는다. 동시에 열 방향 인덱스는 columns 인수로, 행 방향 인덱스는 index 인수로 지정한다. data = { "2015": [9904312, 3448737, 2890451, 2466052], "2010": [9631482, 3393191, 2632035, 2431774], "2005": [9762546, 3512547, 2517680, 2456016], "2000": [9853972, 3655437, 2466338, 24..