일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 응시료
- separating data(데이터 분리하기)
- K 데이터 자격시험
- 시험 일정
- context manger1
- matplotlib
- Seaborn
- numpy
- List Comprehension
- 준비
- 검정수수료
- 빅데이터 분석기사
- teen learn
- pythonML
- Today
- Total
목록Python Machine Learning (8)
재원's 블로그
최초 작성일 : 2021-12-17 categories:Python Machine Learning # ---- 데이터 불러오기 ---- library(ggplot2) # 시각화 코드 # install.packages("dplyr") # install.packages("tidyr") library(dplyr) # 데이터 가공 library(reshape) # 데이터 가공 % select(-1) # raw_reviews % select(-1) glimpse(raw_reviews) colnames(raw_reviews) 상품의 대분류 정보 # ---- 데이터 전처리 ---- # 결측치 확인 colSums(is.na(raw_reviews)) table(raw_reviews$Age) age_group = cut(..
최초 작성일 : 2021-12-24 categories:Python Machine Learning 어제에 이어서 'pipeline 만들기' 실습을 진행하였다. ML Pipeline 학습 곡선 그리기 데이터 불러오기, 훈련세트 분리, pipeline 설계 등 import pandas as pd from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.model_selection import StratifiedKFold import numpy as np from sklearn.linear_model import LogisticRegression fro..
최초 작성일 : 2021-12-23 categories:Python Machine Learning ml(머신 러닝)에서 'pipeline'라는 것을 만들어 사용 할 수 있는데 오늘은 여기에 대해 알아보고 직접 만드는 코드로 실습을 해봤다. ML(머신러닝) PipeLine 기본편 데이터 불러오기 import pandas as pd data_url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/wdbc.data' column_name = ['id', 'diagnosis', 'radius_mean', 'texture_mean&#..
최초 작성일 : 2021-11-04 categories:Python Machine Learning 결정 나무는 머신러닝에서 중요한 개념 중 하나이다. 핵심 컨셉은 아래와 같다. 위 사진을 보면 단계 별로 나눠져 있는데 첫 번째 단계는 우리가 문제가 무엇인지 머신에게 알려주는 ‘Define Problem’과 data를 모아서 주든 어떤 형태로든 머신에게 주는 ‘Collect training data’가 있고 두 번째 단계는 데이터를 만드는 ‘Extract Data’와 결정 나무를 만드는 ‘Build a tree’가 있다. 세 번째는 머신이 작동하는 ‘Deploy machine’이 있다. 마지막 단계는 학습을 통해서 똑똑해진 머신이 우리가 데이터를 제시하면 그걸 구분하는 단계이다. 그리고 장점도 존재한다. ..
최초 작성일 : 2021-11-18 categories: Python Machine Learning 파이썬 머신러닝의 평가지표에는 'MAE', 'MSE', 'RMSE' 이렇게 크게 3가지 종류가 있다. 오늘은 이 3가지에 대해 알아보았다. 1.MAE -'Mean Absolute Error'의 줄임말이다. 실제 값과 예측값의 차이를 절댓값으로 변환해 평균한 것을 말한다. 코드는 아래와 같다. import numpy as np def mean_absolute_error(y_true, y_pred): error = 0 for yt, yp in zip(y_true, y_pred): error = error + np.abs(yt-yp) mae = error / len(y_true) return mae 2.MSE ..
최초 작성일 : 2021-12-08 categories: Python Machine Learning 회귀, 지도학습, 회귀모델, 경사하강법 (비용 최소화하기), 'pycaret(파이 캐럿)', 평가지표, 'EDA'해보기, '데이터 셋 분리 -> ML 모형만들기 -> ML 모형 평가' 해보기 오늘은 큰 틀에서 봤을 때 이렇게 10가지에 알아보고 직접 해보았다. 회귀 - 회귀는 통계학에서 메인 - 유전적 특성 --> 부모(독립변수)의 키가 크더라도 자식(종속변수)의 키가 대를 이어서 무한정 커지지 않고, 부모의 키가 작더라도 자식의 키가 대를 이어서 무한정 작지는 않다. 단순 선형 회귀 --> 단순선형회귀 (변수, feature, 컬럼명) f(x)(y)(종속변수, 반응변) = 기울기(독립변수, 설명변수) 회..
최초 작성일 : 2021-12-06 categories: Python Machine Learning 파이썬 머신러닝에서는 함수를 거의 자신이 만들어 사용하고 정규화 작업 등도 진행한다. 여기에 대해 알아보았다. # /c/Users/GREEN/Desktop/python_fun/venv/Scripts/python # -*- coding: utf-8 -*- def cnt_letter(): """안에 있는 문자를 세는 함수입니다.""" # 함수를 설명하는 문구 print("Hi") return None if __name__ == "__main__": print(cnt_letter()) print(help(cnt_letter)) "C:\Program Files\anaconda3\envs\Python_f\pytho..