일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- teen learn
- pythonML
- context manger1
- 시험 일정
- matplotlib
- numpy
- 응시료
- separating data(데이터 분리하기)
- K 데이터 자격시험
- List Comprehension
- 준비
- 검정수수료
- Seaborn
- 빅데이터 분석기사
- Today
- Total
목록전체 글 (51)
재원's 블로그
최초 작성일 : 2021-11-05 -핵심 개념 - 1. 문자를 숫자로 바꿔줘야 한다. 2. 머신러닝에서 모델을 평가하는데 크게 두가지 방법이 있다. 3. 오차를 구하는데 평균오차가 작은게 제일 좋은 거다.
최초 작성일 : 2021-11-11 - 오늘은 처음으로 나를 포함함 '1팀'전원이 '파워포인트(PPT)'를 이용해서 '포트 폴리오'라는 걸 만들었다. '1팀'팀에서 각자 자신이 맡을 '파트'를 담당해서 서로 서로 돕기도 하면서 조금씩 만들어갔다. 마침내 완성이 됐고, 오전에 제출까지 마치게 되었다. 드디어 일이 하나 줄었다....홀가분하다. 'Kaggle-survey-2021' 대회에 집중 할수 있게 되서 기쁘다.^^
결측치 (Missing Value)는 누락된 값, 비어 있는 값을 의미한다. 실제로도 수집과정에서 발생한 오류로 인해 결측치를 포함하고 있는 경우가 많아 그것을 확인하고 제거하는 정제과정을 거친 후에 분석을 해야 한다. 그럼 확인하고 제거하는 방법 등 을 알아보자. ```python table(is.na(df$score)) ``` ### 여러 변수 동시에 결측치 제거 ```python df_nomiss% filter(!is.na(score) & !is.na(sex)) ▲ score, sex 결측치 제거 ``` ```python mean(df$score, na.rm = T) ▲ mean 에 'na.rm = T' 를 적용해서 결측치 제외하고 평균 산출. exam %>% summarise(mean_math =..