일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- pythonML
- 빅데이터 분석기사
- context manger1
- matplotlib
- 응시료
- List Comprehension
- numpy
- 준비
- 시험 일정
- separating data(데이터 분리하기)
- Seaborn
- K 데이터 자격시험
- 검정수수료
- teen learn
Archives
- Today
- Total
재원's 블로그
R-Text Mining2(R-텍스트 마이닝2) 본문
최초 작성일 : 2021-12-14
categories: R
어제에 이어서 오늘도 '텍스트 마이닝'을
실습 했다.
아래는 시작 전 해야 하는 작업들이다.
<MeCab 설치>
'Mecab-ko' 형태소 분석기 사용 위해서는 Rcppmecab 패키지가 있어야함.
설치를 위한 URL: [URL][[https://github.com/junhewk/RcppMeCab/blob/master/README_kr.md]]
해당 깃허브에서 설치해야 할 파일을 다운로드 받은 후,
- 압축 해제 시에 C drive 에서 mecab folder 생성
- 오른쪽 버튼 클릭 후 여기에 압출풀기를 선택하면 쉽다.
이 과정에서
위의 file 내의 폴더 형태와, file 명, 경로 가 같지 않으면 다음과 같은 에러가 난다.
Exception: list()
- 경로, file명 등을 확인 하기 바란다.
<오류 해결 참조> ![URL][[https://github.com/junhewk/RcppMeCab/issues/12]](https://github.com/junhewk/RcppMeCab/issues/12%5D)
이제 'Mecab'을 'R-studio'를 이용해 'R'에 설치하자
# library(remotes) remotes::install_github("junhewk/RcppMeCab", force = TRUE) library(RcppMeCab)
- RcppMeCab 설치 확인 (형태소 분리기)
한글을 써 본다.
```python
text1 = "안녕하세요?!"
pos(sentence = text1)
text2 = enc2utf8(text1)
pos(sentence = text2)
그러면 이렇게 실행 화면이 나타난다. ```python text2 = enc2utf8(text1) pos(sentence = text2) $안녕하세요?! [1] “안녕/NNG” “하/XSV” “세요/EP+EF” “?/SF” “!/SF”
오늘은 이렇게만 실습을 하였다.
'R' 카테고리의 다른 글
python text maining (R) (3) | 2023.01.23 |
---|---|
R-text maining3 (0) | 2023.01.23 |
R-Text Mining1(R-텍스트 마이닝1) (0) | 2023.01.23 |
R data cleaning method('R' 데이터 정제 방법) (0) | 2023.01.20 |