분류 전체보기 100

[Python] 파이썬 판다스 csv 읽기(불러오기), 저장

파이썬에서 csv 파일을 불러올때는 pandas 라이브러리를 이용한다.csv 파일을 데이터 프레임으로 읽어와서 데이터 분석을 할 수 있다. Python Pandas csv 파일 read, save 먼저, import 하여 pandas 라이브러리 불러오기 및 pd 라는 별칭 지칭하기  파일 읽기 : pd.read_csv() 위의 경우는 data 라는 상위폴더에서  ' test.csv'  파일을 불러와서 'df' 로 저장했다. 불러오고 싶은 파일은 직접 타이핑하거나 탭키로  찾아볼 수 있다. 현재 경로에 있는 파일을 불러오고 싶을때는 ' ./ ' 상위폴더 경로에서  파일을 찾고 싶을 때는 ' ../ '  파일 저장 : .to_csv()csv 파일 작업을 마친 후에는 다른 이름으로 저장하는 것도 가능하다. '..

[Python] 파이썬 넘파이 데이터 접근하기

인덱스 또는 조건을 넣으면 데이터를 엑세스 할 수 있다. Python NumPy 데이터 접근변수명[인덱스] : 인덱스에 해당하는 데이터를 출력변수명[조건] : 조건에 맞는 데이터를 출력  다차원배열에서 인덱스 접근하기  Slicing : 잘라서 가져오기ndarray[ start : end+1 ] start부터 end까지ndarray[ start : ] start부터 끝까지 ndarray[ : end+1 ] 처음부터 end까지     다차원배열의 슬라이싱은,[ 행, 열 ] 을 적어준다.단, 열자리는 생략가능하지만, 행 자리를 적어주지 않으면 오류가 발생한다.   변수명[인덱스] = value 를 이용해 데이터 변경하기도 가능하다.   .copy() : 슬라이싱한 데이터를 새로운 변수에 저장해도 데이터가 공..

[Python] 파이썬 판다스 1차원배열, 2차원배열 데이터(Series, DataFrame) 생성하기

Pandas는 NumPy 라이브러리를 랩핑한 오픈소스 라이브러리로,  NumPy 데이터에 여러 함수가 결합되어 확장된 넘파이 데이터 structure 이다. Python Pandas 1차원 배열, 2차원 배열 생성하기1차원 배열은 Series, 2차원 배열은 DataFrame 이라고 한다. Pandas는 엑셀의 기능을 제공하는 모듈로,DataFrame은 엑셀에서 볼 수 있는 시트처럼 행과 열로 되어 있다.Series는 엑셀 시트의 1열을 의미한다.   실행하기판다스를 pd라는 별칭으로 임포트 한다.   pd.Series(data=, index=): 시리즈 생성하기Series는 index를 가질 수 있고, index를 기반으로 데이터에 access 할 수 있다.index 변경할 수 있다.ndarray와는 ..

[Python] 파이썬 최대값, 최소값, 전체합, 전체평균, 표준편차, 중앙값(max, min, sum, mean, std, median)과 위치 찾기(argmax, argmin)

max() : 최대값min() : 최소값sum() : 전체합mean() : 전체평균 std() : 표준편차 median() : 중앙값argmax() : 최대값이 들어있는 인덱스argmin() : 최소값이 들어있는 인덱스 Python  NumPy 최대값/ 최소값과 위치 찾기  각 행 또는 각 열별로 데이터를 분석하는 방법은,axis 를 적어주면 된다.axis = 1 : 행axis = 0 : 열  각 행별로 최대값/최소값의 위치를 찾는 방법은?argmax(axis=1) : 각 행에서 최대값이 들어있는 인덱스 추출argmin(axis=1 ) : 각 행에서 최소값이 들어있는 인덱스 추출각 열별로 최대값/최소값의 위치를 찾고 싶을 때는, axis=0을 넣어주면 된다.

[Python] 리스트 원소 바꾸기(변환), 추가, 삭제

리스트 원소를 바꾸고, 추가하고, 삭제해 보자. Python List 원소 바꾸기, 추가하기, 삭제하기' score_list' 라는 리스트를 활용해 보자.score_list = [100, 90, 75, 68, 98] 바꾸기(변환하기)100 >> 99 로 바꾸기! 변수명[100의 인덱스] = 변환 값score_list [0]  = 99  =>  score_list = [99, 90, 75, 68, 98]   추가하기 '50'을 추가해 보자!변수명.append(추가할 value)score_list.append(50)  => score_list = [99, 90, 75, 68, 98, 50]   삭제하기' 90 '을 삭제해 보자!del 변수명[90의 인덱스]del score_list [1]   => score..

[Python] 파이썬 넘파이 실행 및 배열 만들기 np.array, np.zeros, np.ones, np.full, np.arange, np.linspace

NumPy(Numerical Python)는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리로,과학 계산 및 데이터 분석에 유용하다.(원소는 동일한 자료형이어야 한다)실행이 안되면 아나콘다프롬프트에서 conda install numpy 를 실행하여 설치하면 된다. Python NumPy 실행 및 배열 만들기넘파이 호출하기:import numpy as np(넘파이를 np라는 별칭 사용하기)   1차원 배열 = 벡터 (Vector)2차원 배열 = 행렬 (Matrix) 3차원 배열=텐서(Tensor)  Numpy 배열 만들기 np.array(): 리스트 또는 튜플을 Numpy 배열로 변환 np.zeros():  입력한 숫자만큼 0이 들어있는 배열 np.ones(): 입력한 숫자..

[Python] 파이썬 문자열 추출 인덱싱, 슬라이싱, 문자열 뒤집기, 건너뛰기

파이썬 문자열 추출은 문자열[인덱스] 를 이용한다. Python 문자열 추출 Indexing, Slicing 인덱싱 indexing문자열의 각각 문자에는 인덱스(순서)가 있다.처음 문자부터 마지막 문자까지 순서대로 번호가 매겨지는데, 그것을 인덱스라 한다.첫번째 문자의 인덱스는 0, 오른쪽으로 갈수록 증가마지막 문자의 인덱스는 -1, 왼쪽으로 갈수록 감소 'Hello World'[0]을 출력하면 'H' H 인덱스 = 0 또는 -11e 인덱스 = 1 또는 -10l 인덱스 = 2,3 또는 -9,-8o 인덱스 = 4 또는 -7띄어쓰기 인덱스 = 5 또는 -6(공란도 인덱스를 갖는다)W 인덱스 = 6  또는 -5...  슬라이싱 slicing인덱스는 하나의 문자만 추출할 수 있는데, 슬라이싱은 문자열을 추출할 ..

[Python] 파이썬 리스트 생성하기, 데이터 추가/삭제하기(append, del)

Python List 에 다양한 데이터 타입을 순서대로 저장할 수 있다.다만, 다양한 연산을 적용시키기는 힘든 단점도 있다.  Python List 생성하기, 데이터 추가/ 삭제하기 리스트의 특징순서가 있는 자료구조로, 인덱스를 통해 각 요소에 접근할 수 있다.다양한 데이터 타입(정수, 실수, 문자열, 불린 등)을 포함할 수 있다.크기가 동적이다.중복된 값을 포함할 수 있다. 리스트 생성 하기대괄호 [ ] 안에, 쉼표로 구분한 값들을 넣어 주면 된다.  리스트 생성  빈 리스트 생성아무것도 없는 빈 리스트도 생성할 수 있다.   데이터 추가하기append()  데이터 삭제하기del  리스트명[삭제할 인덱스]인덱스 -1은 마지막 데이터를 가르킨다. sum(변수) : 변수의 모든 원소들의 합을 구할 수 있다..