일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- numpy
- 검정수수료
- List Comprehension
- context manger1
- 시험 일정
- teen learn
- 응시료
- 빅데이터 분석기사
- separating data(데이터 분리하기)
- Seaborn
- 준비
- matplotlib
- pythonML
- K 데이터 자격시험
- Today
- Total
목록Kaggle (3)
재원's 블로그
최초 작성일 : 2021-12-10 categories:kaggle 오늘은 'kaggle' 대회 사이트에서 'house-prices-advanced-regression-techniques' 데이터를 가져와서 '데이터 전처리' ~ 'ML 모형 평가' 까지 한번 해 보았다. 데이터 불러오기 변수를 줄여야겠다! 어떤 변수를 줄여야할까? import pandas as pd train = pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/train.csv") test = pd.read_csv("/kaggle/input/house-prices-advanced-regression-te..
최초 작성일 : 2021-11-08 categories:kaggle import numpy as np import pandas as pd import matplotlib.pyplot as plt # matplotlib와 그 안의 'plot(그래프)'를 import 한다는 뜻 import plotly.express as px #Express는 plotly라이브러리 에 내장된 일부 함수이고 이 함수를 import한다는 뜻. import plotly.graph_objects as go #plotly.graph_objects모듈을 import한다는 뜻. from warnings import filterwarnings #경고 메시지가 뜨지않게 예외처리 해준다는 뜻. filterwarnings(..
최초 작성일 : 2021-11-17 categories:kaggle 오늘은 ‘kaggle-surve-2021’ 질문지에서 질문 항목을 출력하는 작업을 했다. 아래 코드는 가장 기본적인 코드이다. df['Q11'].value_counts() #원하는 질문값을 '[]' 안에 'Q~~'이런식으로 Q와 번호를 써주면 질문안의 데이터가 출력된다. df_note = pd.DataFrame() #질문 항목 중 'Part'가 붙은 질문은 이런식으로 '반복문'을 작성해서 데이터 목록을 출력한다. df_note['std_notebook'] = [df_std[col][1:].value_counts().index[0] for col in d..