일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 시험 일정
- teen learn
- context manger1
- 검정수수료
- numpy
- List Comprehension
- 응시료
- 빅데이터 분석기사
- pythonML
- 준비
- Seaborn
- matplotlib
- separating data(데이터 분리하기)
- K 데이터 자격시험
- Today
- Total
목록R (5)
재원's 블로그
최초 작성일 : 2021-12-15 categories:R -빅데이터 분석 및 시각화 & 텍스트 마이닝 Ref-01 [Matplotlib-histogram 그리기][https://wikidocs.net/92112] Ref-02 [딥 러닝을 이용한 자연어 처리 입문-네이버 쇼핑 리뷰 감성 분류하기][https://wikidocs.net/94600] 다음은 네이버 쇼핑 리뷰 감성 분류하기 예제입니다. 빈칸에 # 코드 입력란에 적당한 코드를 작성하시기를 바랍니다. 각 빈칸당 10점입니다. # Colab에 Mecab 설치 !git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git %cd Mecab-ko-for-Google-Colab !bash ins..
최초 작성일 : 2021-12-15 categories: R 앞에 실습했던 내용은 아래 주소로 들어가면 볼 수 있다. [R-text maining][https://kjw3226.tistory.com/33] : library(KoNLP), useNIADic() 사용/설치 확인 [R-test mainig2][https://kjw3226.tistory.com/35] : Rcppmecab 설치, 확인 다음 내용 : ※ 참고로 'Lecture' 폴더는 개인적으로 공부한 내용이기도 하고 보안상의 문제로 공유를 못하는 점 양해부탁드립니다. 앞에 설치했던 파일들을 바탕으로 Text Mainig을 해보자. 위의 'Lecture' 링크에 들어가서 수집을 하면 된다. [cheatsheets][h..
최초 작성일 : 2021-12-14 categories: R 어제에 이어서 오늘도 '텍스트 마이닝'을 실습 했다. 아래는 시작 전 해야 하는 작업들이다. 'Mecab-ko' 형태소 분석기 사용 위해서는 Rcppmecab 패키지가 있어야함. 설치를 위한 URL: [URL][[https://github.com/junhewk/RcppMeCab/blob/master/README_kr.md]] 해당 깃허브에서 설치해야 할 파일을 다운로드 받은 후, 압축 해제 시에 C drive 에서 mecab folder 생성 오른쪽 버튼 클릭 후 여기에 압출풀기를 선택하면 쉽다. 이 과정에서 위의 file 내의 폴더 형태와, file 명, 경로 가 같지 않으면 다음과 같은 에러가 난다. Except..
최초 작성일 : 2021-12-14 categories:R 오늘은 'R studio'에서 'Text Mining'을 직접 해 보았다. 시작 전 R 환경 설정을 먼저 해야 한다. 아래는 환경설정 코드들이다. install.packaged("multilinguer") #위에 Install이 안되면, 아래 것으로 설치 install.packages("remotes") remotes::install_github("mrchypark/multilinguer") install_jdk() #자바 설치가 자동으로 path 설정 까지 될 수 있도록 해줌 이렇게 해 준 다음 'R tools'를 설치 해준다. 아래의 주소로 들어가면 설치가 가능하다. https://cran.r-pro..
결측치 (Missing Value)는 누락된 값, 비어 있는 값을 의미한다. 실제로도 수집과정에서 발생한 오류로 인해 결측치를 포함하고 있는 경우가 많아 그것을 확인하고 제거하는 정제과정을 거친 후에 분석을 해야 한다. 그럼 확인하고 제거하는 방법 등 을 알아보자. ```python table(is.na(df$score)) ``` ### 여러 변수 동시에 결측치 제거 ```python df_nomiss% filter(!is.na(score) & !is.na(sex)) ▲ score, sex 결측치 제거 ``` ```python mean(df$score, na.rm = T) ▲ mean 에 'na.rm = T' 를 적용해서 결측치 제외하고 평균 산출. exam %>% summarise(mean_math =..