분류 전체보기 100

[streamlit] DataFrame을 웹 화면에 보여주기

Python streamlit 에서  DataFrame 웹 화면에 표시 ▷ 실행# 판다스 데이터 프레임을 웹 화면에 보여주는 방법import streamlit as stimport pandas as pddef main() :    df = pd.read_csv('./data/iris.csv')        st.dataframe(df)    # species 컬럼의 유니크 값을 화면에 표시        st.write(df['species'].unique())    st.text('아이리스 꽃은' + df['species'].unique() + '로 되어 있다.')if __name__ == '__main__' :    main()  ▶ 결과

[streamlit] 제목, 텍스트, 메시지 설정하는 방법

Python Sreamlit title, text, 메시지 설정 텍스트 표시st.title(): 웹 페이지의 제목 표시할 때st.text(): 일반 텍스트를 표시할 때st.header(): 헤더 텍스트를 표시할 때st.subheader(): 서브 헤더 텍스트를 표시할 때 메시지 표시st.success():  그린색의 텍스트와 바탕색을 표시st.warning():  노란색의 텍스트와 바탕색을 표시st.info(): 파란색의 텍스트와 바탕색을 표시st.error(): 붉은색의 텍스트와 바탕색을 표시 ▷ 실행import streamlit as stdef main() :    # 텍스트를 표시하는 방법    st.title('웹 대시보드')    st.text('웹 대시보드 개발하기')        name =..

[streamlit] 설치, 시작하기

streamlit 은 웹 대시보드 개발 라이브러리 이다. Python Streamlit 설치, 시작하기 1. 스트림릿 공식사이트 (https://streamlit.io/) 접속  Streamlit • A faster way to build and share data appsStreamlit is an open-source Python framework for machine learning and data science teams. Create interactive data apps in minutes.streamlit.io  2. 메인 화면에서 Try Streamlit now  클릭   3. 스트림릿 인스톨 pip install streamlit 카피 후 아나콘다 프롬프트에 입력하면 설치 완료!   4...

[Machine Learning] 데이터 분할, train_test_split

데이터 분할은,머신러닝에서 우리가 가지고 있는 정보(data)를 이용해 예측력이 좋은 모델을 찾기 위해  ① 훈련 데이터(train data)와 테스트 데이터(test data)로 분할하고,  ② train data를 학습시킨 후 test data를 사용하여,  모델이 학습하지 않은 새로운 데이터를 얼마나 잘 처리하는지를 확인해 보고  더 나은 모델을 개발 하기 위한 필수 과정이다.  - 라이브러리 불러오기 # X_train, X_test, y_train, y_test 순서 바뀌면 안됨.   test_size : 전체 데이터 중 테스트 데이터로 사용할 비율 test_size = 0.2 : 전체 데이터의 20%를 테스트 데이터로, 나머지 80%를 훈련 데이터로 사용  train data를 학습시킨 모델에 ..

[Machine Learning] 머신러닝 전처리, 문자열을 숫자로, 레이블 인코딩, 원핫 인코딩

컴퓨터는 숫자로 처리된 데이터를 읽을 수 있기 때문에, 숫자가 아닌 데이터는 숫자로 바꿔줘야 한다.  데이터를 숫자로 변경하는 방법- 레이블 인코딩(Label Encoding)- 원핫 인코딩(One Hot Encoding)  ① 문자열 컬럼의 유니크 갯수를 확인한다.② 갯수가 2개이면, 0과 1로 바꾸면 되기 때문에 레이블 인코딩을 사용하면 된다.③ 갯수가 3개 이상이면, 원핫 인코딩을 사용하여, 0과 1로 표현하도록 변경한다.  데이터프레임 X의 'Country' 컬럼에 있는 값들을 레이블 인코딩과 원핫 인코딩 해보자. - 라이브러리 불러오기 1. LabelEncoder 객체 생성 후 인코딩  2. ColumnTransformer를 이용하여 OneHotEncoder 객체 생성 후 인코딩

[Machine Learning] 머신러닝 피처 스케일링, 표준화, 정규화

피처 스케일링(Feature Scaling)표준화(Standardization )정규화(Normalization) 피처 스케일링(Feature Scaling) 이란?서로 다른 변수의 값의 범위를 맞추는 것. Why?유클리디언 디스턴스로 오차를 줄여 나가는데, 하나의 변수는 오차가 크고, 하나의 변수는 오차가 작으면, 나중에 오차를 수정할때 편중되게 된다. 따라서 값의 레인지를 맞춰줘야 정확히 트레이닝 된다. Feature Scaling 2가지 방법- 표준화 : 평균을 기준으로 얼마나 떨어져 있느냐? 같은 기준으로 만드는 방법, 음수도 존재, 데이터의 최대최소값 모를때 사용.- 정규화 : 0 ~ 1 사이로 맞추는 것. 데이터의 위치 비교가 가능, 데이터의 최대최소값 알 때 사용

[Machine Learning] 선형 회귀 Linear Regression을 이용한 수치 예측

Linear Regression: 평수·지역에 따른 집 값이나 연봉,  보험료 등과 같은 수치를 예측해 볼 수 있는 머신러닝 모델이다.  예측 과정은 데이터 분포를 만족하는 직선을 찾는 것이 목표다. 주어진 x, y  데이터를 이용해 우리가 잘 아는 직선의 방정식에서 기울기(b1)과  y절편(b0)을 찾아가는 과정인데 이를 학습이라고 부른다.여기에서 학습이란?  바로 error(오차)를 줄여 나가는 것이다. 모든 관측점(Observation) 에서 y값의 error(오차)가 존재하고, 이 오차들의 총 합을 줄여 나가면 된다. 오차를 점차 줄여 나가서 최소값이 되는 직선을 찾으면 끝난다.   - 과정 -1. Nan 처리하기2. 데이터 프레임의 컬럼을 X와 y로 분리하기3. 문자열 데이터를 숫자로 변경하기L..

[Python]Matplotlib 그래프 그리기, 저장하기

Matplotlib는,파이썬에서 가장 널리 사용되는 데이터 시각화 라이브러리이다. Python Matplotlib 그래프 그리기, 저장하기1. matplot 라이브러리 불러오기   2. 넘파이를 이용해, 그래프 그려줄 x, y 값 정하기    3. 그래프 나타내기 & 저장하기  plt.savefig() : 그래프를 파일로 저장한다.  plt.show() : 그래프 출력 메모리 표시를 없애준다.

[Python] 파이썬 넘파이 boolean연산, 브로드캐스팅

boolean연산 : True 또는 False 두 개의 값만을 가지는 자료형브로드캐스팅 : 넘파이에서 서로 다른 모양(shape)의 배열도 일정 조건을 만족하면 자동으로 확장하여 연산 Python NumPy boolean연산, 브로드캐스팅boolean 연산데이터 엑세스에서 and, or 연산자를 사용하지 않고 &, | 를 사용한다.   브로드캐스팅각 요소마다 연산이 수행된다.

[Python] 파이썬 산술 연산자, 비교 연산자, 논리 연산자

산술 연산(+, -, *, /, **, %)비교 연산(>, =, 논리 연산(and, or, not) Python 산술 연산자, 비교 연산자, 논리 연산자산술 연산+ : 더하기- : 빼기 * : 곱하기 ** : 제곱  / : 나누기// : 몫 % : 나머지 비교 연산A > B : A가 B보다 크다.A B : A가 B보다 작다.A >= B : A가 B보다 크거나 같다.A A == B : A와 B는 같다.A != B : A와 B는 같지 않다.  논리 연산and : 두 조건이 모두 참일때만 True를 출력하고 나머지는 False로 출력한다.or : 두 조건 중 하나만 참이여도 True를 출력하고,  모두 거짓이어야 Fasle를 출력한다.not : 참이면 False, 거짓이면 True를 출력한다.