| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- python algorithm
- 파이썬 데이터프레임
- Algorithm
- HTML
- 알고리즘
- Oracle VM VirtualBox
- tibero
- linux
- RFP
- VirtualBox
- 리눅스
- it용어
- putty
- it 용어
- 파이썬
- PYTHON
- C#
- Python DataFrame
- 리눅스 명령어
- 데이터베이스
- 코딩테스트
- Python 라이브러리
- 오라클
- csharp
- 파이썬 전처리
- dbeaver
- MariaDB
- Oracle
- 파이썬 알고리즘
- sql
- Today
- Total
목록python pandas (2)
오경석의 개발노트
Series Class Series(시계열)는 Numpy에서 제공하는 1차원 배열과 비슷하지만 각 데이터의 의미를 표시하는 인덱스(index)를 붙일 수 있다. 데이터 자체는 값(value)라고 한다. 대부분의 데이터는 시계열(series)이나 표(table)의 형태로 나타낼 수 있다. 판다스는 이러한 데이터를 다루기 위한 시리즈(Series) 클래스와 데이터프레임(DataFrame) 클래스를 제공한다. 시리즈 = 값(value) + 인덱스(index) Series 생성 데이터를 리스트나 1차원 배열 형식으로 Series 클래스 생성자에 넣어주면 시리즈 클래스 객체를 만들 수 있다. 이 때 인덱스의 길이는 데이터의 길이와 같아야 한다. 다음 예에서 '서울', '부산'등의 문자열이 인덱스의 값이다. 인덱스..
Pandas 개념 Pandas는 파이썬에서 사용하는 데이터 분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리하는데 매우 편리한 도구이다. Pandas는 수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터를 제공하는데, Pandas는 R에서 사용되던 data.frame 구조를 본뜬 DataFrame이라는 구조를 사용하기 때문에, R의 data.frame에서 사용하던 기능 상당수를 무리 없이 사용할 수 있도록 만들었다. 더욱이 파이썬이라는 접근성이 좋은 언어 기반으로 동작하기 때문에 데이터 분석을 파이썬으로 입문하는 사람들이 필수적으로 사용하는 라이브러리가 되었다. Pandas 라이브러리의 주요 코드는 Python이나 C로 작..