Pandas는 NumPy 라이브러리를 랩핑한 오픈소스 라이브러리로,
NumPy 데이터에 여러 함수가 결합되어 확장된 넘파이 데이터 structure 이다.
Python Pandas 1차원 배열, 2차원 배열 생성하기
1차원 배열은 Series, 2차원 배열은 DataFrame 이라고 한다.
Pandas는 엑셀의 기능을 제공하는 모듈로,
DataFrame은 엑셀에서 볼 수 있는 시트처럼 행과 열로 되어 있다.
Series는 엑셀 시트의 1열을 의미한다.
실행하기
판다스를 pd라는 별칭으로 임포트 한다.
pd.Series(data=, index=)
: 시리즈 생성하기
Series는 index를 가질 수 있고, index를 기반으로 데이터에 access 할 수 있다.
index 변경할 수 있다.
ndarray와는 다르게 세로로 출력된다.
pd.DataFrame(data = )
: 데이터 프레임 생성하기
실제 데이터 분석에서는 csv 파일을 판다스의 데이터 프레임으로 읽어와서 작업한다.
- 왼쪽의 진한글씨 : 인덱스(index)
- 위쪽의 진한글씨 : 컬럼(column)
- 안쪽에 위치한 데이터 : values
'Data Analysis > Python' 카테고리의 다른 글
[Python] 파이썬 넘파이 데이터 접근하기 (0) | 2024.04.05 |
---|---|
[Python] 파이썬 판다스 (NaN) 결측치 처리하기 (0) | 2024.04.05 |
[Python] 파이썬 최대값, 최소값, 전체합, 전체평균, 표준편차, 중앙값(max, min, sum, mean, std, median)과 위치 찾기(argmax, argmin) (0) | 2024.04.04 |
[Python] 리스트 원소 바꾸기(변환), 추가, 삭제 (0) | 2024.04.04 |
[Python] 파이썬 주석 처리, 한줄, 여러줄 (0) | 2024.04.04 |