'분류 전체보기' 카테고리의 글 목록 (10 Page)

[Python] 파이썬 판다스 csv 읽기(불러오기), 저장

파이썬에서 csv 파일을 불러올때는 pandas 라이브러리를 이용한다.csv 파일을 데이터 프레임으로 읽어와서 데이터 분석을 할 수 있다. Python Pandas csv 파일 read, save 먼저, import 하여 pandas 라이브러리 불러오기 및 pd 라는 별칭 지칭하기 파일 읽기 : pd.read_csv() 위의 경우는 data 라는 상위폴더에서 ' test.csv' 파일을 불러와서 'df' 로 저장했다. 불러오고 싶은 파일은 직접 타이핑하거나 탭키로 찾아볼 수 있다. 현재 경로에 있는 파일을 불러오고 싶을때는 ' ./ ' 상위폴더 경로에서 파일을 찾고 싶을 때는 ' ../ ' 파일 저장 : .to_csv()csv 파일 작업을 마친 후에는 다른 이름으로 저장하는 것도 가능하다. '..

Data Analysis/Python 2024.04.05

[Python] 파이썬 넘파이 데이터 접근하기

인덱스 또는 조건을 넣으면 데이터를 엑세스 할 수 있다. Python NumPy 데이터 접근변수명[인덱스] : 인덱스에 해당하는 데이터를 출력변수명[조건] : 조건에 맞는 데이터를 출력 다차원배열에서 인덱스 접근하기 Slicing : 잘라서 가져오기ndarray[ start : end+1 ] start부터 end까지ndarray[ start : ] start부터 끝까지 ndarray[ : end+1 ] 처음부터 end까지 다차원배열의 슬라이싱은,[ 행, 열 ] 을 적어준다.단, 열자리는 생략가능하지만, 행 자리를 적어주지 않으면 오류가 발생한다. 변수명[인덱스] = value 를 이용해 데이터 변경하기도 가능하다. .copy() : 슬라이싱한 데이터를 새로운 변수에 저장해도 데이터가 공..

Data Analysis/Python 2024.04.05

[Python] 파이썬 판다스 (NaN) 결측치 처리하기

NaN(Not a Number) 은 해당 항목에 값이 없음을 의미한다. Python Pandas 결측치 처리하기결측치 확인하기.isna() .notna() (↔isna) : 비어있지 않는 데이터를 확인하는 방법. 결측치 처리하기 1. NaN 삭제.dropna() 2. 특정 값으로 채우기.fillna()

Data Analysis/Python 2024.04.05

[Python] 파이썬 판다스 1차원배열, 2차원배열 데이터(Series, DataFrame) 생성하기

Pandas는 NumPy 라이브러리를 랩핑한 오픈소스 라이브러리로, NumPy 데이터에 여러 함수가 결합되어 확장된 넘파이 데이터 structure 이다. Python Pandas 1차원 배열, 2차원 배열 생성하기1차원 배열은 Series, 2차원 배열은 DataFrame 이라고 한다. Pandas는 엑셀의 기능을 제공하는 모듈로,DataFrame은 엑셀에서 볼 수 있는 시트처럼 행과 열로 되어 있다.Series는 엑셀 시트의 1열을 의미한다. 실행하기판다스를 pd라는 별칭으로 임포트 한다. pd.Series(data=, index=): 시리즈 생성하기Series는 index를 가질 수 있고, index를 기반으로 데이터에 access 할 수 있다.index 변경할 수 있다.ndarray와는 ..

Data Analysis/Python 2024.04.05

[Python] 파이썬 최대값, 최소값, 전체합, 전체평균, 표준편차, 중앙값(max, min, sum, mean, std, median)과 위치 찾기(argmax, argmin)

max() : 최대값min() : 최소값sum() : 전체합mean() : 전체평균 std() : 표준편차 median() : 중앙값argmax() : 최대값이 들어있는 인덱스argmin() : 최소값이 들어있는 인덱스 Python NumPy 최대값/ 최소값과 위치 찾기 각 행 또는 각 열별로 데이터를 분석하는 방법은,axis 를 적어주면 된다.axis = 1 : 행axis = 0 : 열 각 행별로 최대값/최소값의 위치를 찾는 방법은?argmax(axis=1) : 각 행에서 최대값이 들어있는 인덱스 추출argmin(axis=1 ) : 각 행에서 최소값이 들어있는 인덱스 추출각 열별로 최대값/최소값의 위치를 찾고 싶을 때는, axis=0을 넣어주면 된다.

Data Analysis/Python 2024.04.04

[Python] 리스트 원소 바꾸기(변환), 추가, 삭제

리스트 원소를 바꾸고, 추가하고, 삭제해 보자. Python List 원소 바꾸기, 추가하기, 삭제하기' score_list' 라는 리스트를 활용해 보자.score_list = [100, 90, 75, 68, 98] 바꾸기(변환하기)100 >> 99 로 바꾸기! 변수명[100의 인덱스] = 변환 값score_list [0] = 99 => score_list = [99, 90, 75, 68, 98] 추가하기 '50'을 추가해 보자!변수명.append(추가할 value)score_list.append(50) => score_list = [99, 90, 75, 68, 98, 50] 삭제하기' 90 '을 삭제해 보자!del 변수명[90의 인덱스]del score_list [1] => score..

Data Analysis/Python 2024.04.04

[Python] 파이썬 주석 처리, 한줄, 여러줄

주석은 코드로 인식되지 않아 코드의 설명을 남겨놓을 때 사용할 수 있다. Python 주석 처리 한 줄 주석 : # 단축키 : ctrl + / 여러 줄 주석 : ''' ''' 또는 """ """주석처리할 내용 앞뒤에 작은 따옴표(') 또는 큰 따옴표(")를 3개씩 넣어준다. 한 줄 주석 여러 줄 주석

Data Analysis/Python 2024.04.04

[Python] 파이썬 넘파이 실행 및 배열 만들기 np.array, np.zeros, np.ones, np.full, np.arange, np.linspace

NumPy(Numerical Python)는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리로,과학 계산 및 데이터 분석에 유용하다.(원소는 동일한 자료형이어야 한다)실행이 안되면 아나콘다프롬프트에서 conda install numpy 를 실행하여 설치하면 된다. Python NumPy 실행 및 배열 만들기넘파이 호출하기:import numpy as np(넘파이를 np라는 별칭 사용하기) 1차원 배열 = 벡터 (Vector)2차원 배열 = 행렬 (Matrix) 3차원 배열=텐서(Tensor) Numpy 배열 만들기 np.array(): 리스트 또는 튜플을 Numpy 배열로 변환 np.zeros(): 입력한 숫자만큼 0이 들어있는 배열 np.ones(): 입력한 숫자..

Data Analysis/Python 2024.04.04

[Python] 파이썬 문자열 추출 인덱싱, 슬라이싱, 문자열 뒤집기, 건너뛰기

파이썬 문자열 추출은 문자열[인덱스] 를 이용한다. Python 문자열 추출 Indexing, Slicing 인덱싱 indexing문자열의 각각 문자에는 인덱스(순서)가 있다.처음 문자부터 마지막 문자까지 순서대로 번호가 매겨지는데, 그것을 인덱스라 한다.첫번째 문자의 인덱스는 0, 오른쪽으로 갈수록 증가마지막 문자의 인덱스는 -1, 왼쪽으로 갈수록 감소 'Hello World'[0]을 출력하면 'H' H 인덱스 = 0 또는 -11e 인덱스 = 1 또는 -10l 인덱스 = 2,3 또는 -9,-8o 인덱스 = 4 또는 -7띄어쓰기 인덱스 = 5 또는 -6(공란도 인덱스를 갖는다)W 인덱스 = 6 또는 -5... 슬라이싱 slicing인덱스는 하나의 문자만 추출할 수 있는데, 슬라이싱은 문자열을 추출할 ..

Data Analysis/Python 2024.04.03

[Python] 파이썬 리스트 생성하기, 데이터 추가/삭제하기(append, del)

Python List 에 다양한 데이터 타입을 순서대로 저장할 수 있다.다만, 다양한 연산을 적용시키기는 힘든 단점도 있다. Python List 생성하기, 데이터 추가/ 삭제하기 리스트의 특징순서가 있는 자료구조로, 인덱스를 통해 각 요소에 접근할 수 있다.다양한 데이터 타입(정수, 실수, 문자열, 불린 등)을 포함할 수 있다.크기가 동적이다.중복된 값을 포함할 수 있다. 리스트 생성 하기대괄호 [ ] 안에, 쉼표로 구분한 값들을 넣어 주면 된다. 리스트 생성 빈 리스트 생성아무것도 없는 빈 리스트도 생성할 수 있다. 데이터 추가하기append() 데이터 삭제하기del 리스트명[삭제할 인덱스]인덱스 -1은 마지막 데이터를 가르킨다. sum(변수) : 변수의 모든 원소들의 합을 구할 수 있다..

Data Analysis/Python 2024.04.02

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

MI's Recording

분류 전체보기 100

티스토리툴바