일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- PYTHON
- 파이썬
- 데이터베이스
- VirtualBox
- 코딩테스트
- linux
- Python 라이브러리
- it용어
- Python DataFrame
- putty
- 리눅스 명령어
- 파이썬 알고리즘
- Oracle VM VirtualBox
- Oracle
- sql
- RFP
- dbeaver
- Algorithm
- it 용어
- MariaDB
- 알고리즘
- csharp
- HTML
- 리눅스
- 파이썬 데이터프레임
- 파이썬 전처리
- python algorithm
- tibero
- 오라클
- C#
- Today
- Total
오경석의 개발노트
Python_Pandas 본문
Pandas 개념
Pandas는 파이썬에서 사용하는 데이터 분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리하는데 매우 편리한 도구이다.
Pandas는 수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터를 제공하는데, Pandas는 R에서 사용되던 data.frame 구조를 본뜬 DataFrame이라는 구조를 사용하기 때문에, R의 data.frame에서 사용하던 기능 상당수를 무리 없이 사용할 수 있도록 만들었다.
더욱이 파이썬이라는 접근성이 좋은 언어 기반으로 동작하기 때문에 데이터 분석을 파이썬으로 입문하는 사람들이 필수적으로 사용하는 라이브러리가 되었다. Pandas 라이브러리의 주요 코드는 Python이나 C로 작성되었으며, 퍼포먼스에 최적화되어있다. Pandas의 개발자인 웨스 메키니는 금융 데이터에 대한 계량적 분석을 수행하기 위한 고성능의 유연한 툴을 만들 필요가 있다 생각하여 AQR Capital Management에서 근무하던 2008년부터 Pandas 개발 작업을 시작하였다. Pandas의 이름은 계량 경제학에서 사용되는 용어인 'PANel DAta'의 앞 글자를 따서 지어졌다. 3조항 BSD 라이선스 조건 하에서 무료로 사용 가능하다.
Pandas의 주요 특성
- 통합 인덱싱을 활용한 데이터 조작을 가능하게 하는 데이터프레임(DataFrame) 오브젝트
- 인메모리(in-memory) 데이터 구조와 다양한 파일 포맷들 간의 데이터 읽기/스기 환경 지원
- 데이터 결측치의 정렬 및 처리
- 데이터셋의 재구조화 및 피보팅
- 레이블 기반의 슬라이싱, 잘 지원된 인덱싱, 대용량 데이터셋에 대한 서브셋 지원
- 데이터 구조의 칼럼 추가 및 삭제
- 데이터셋의 분할-적용-병합을 통함 GroupBy 엔진 지원
- 데이터셋 병합(merging) 및 조인(joining) 지원
- 저차원 데이터에서의 고차원 데이터 처리를 위한 계층적 축 인덱싱 지원
- data range, 빈도 변환, 이동 창 통계, 이동 창 선형회귀, 날짜 이동 등의 시계열 작업 지원
- 데이터 필터링 지원
Pandas Package Import
Pandas 패키지르 사용하기 위해 우선 import를 해야 한다. Pandas 패키지는 pd라는 별칭으로 임포트하는 것이 관례이므로 여기에서도 해당 관례를 따르도록 한다.
import pandas as pd
출처 : https://pandas.pydata.org/about/
pandas - Python Data Analysis Library
About pandas History of development In 2008, pandas development began at AQR Capital Management. By the end of 2009 it had been open sourced, and is actively supported today by a community of like-minded individuals around the world who contribute their va
pandas.pydata.org
출처 : https://namu.wiki/w/Pandas
Pandas - 나무위키
통합 인덱싱을 활용한 데이터 조작을 가능하게 하는 데이터프레임(DataFrame) 오브젝트인메모리(in-memory) 데이터 구조와 다양한 파일 포맷들 간의 데이터 읽기/쓰기 환경 지원데이터 결측치의 정렬
namu.wiki
4.1 판다스 패키지의 소개 — 데이터 사이언스 스쿨
.ipynb .pdf to have style consistency -->
datascienceschool.net
'프로그래밍 언어 > Python' 카테고리의 다른 글
Python_DataFrame (1) | 2022.09.06 |
---|---|
Python_Series (0) | 2022.09.06 |
Python_csv파일 불러오기 (0) | 2022.09.05 |
Python_변수의 개념과 생성, 작명법 (0) | 2022.09.05 |
Python_스타일 가이드 (0) | 2022.09.02 |