728x90
SMALL
1. 글을 쓰게 된 계기
Mecab을 이용해서 형태소 분석을 하려고 했으나 다음과 같은 오류가 나서 해결하고자 한다.
2. 해결방법
3가지 설치 과정을 통해 문제를 해결할 수 있습니다.
1. mecab-ko 설치
2. mecab-dic 설치
3. mecab-python 설치
1. mecab-ko 설치
- Mecab을 wget을 이용해 설치합니다.
wget https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.2.tar.gz
- 해당 파일 압축을 해제합니다.
tar xvfz mecab-0.996-ko-0.9.2.tar.gz
- 해제 후 다음코드를 차례대로 설치합니다.
cd mecab-0.996-ko-0.9.2
./configure
make
make check
sudo make install
2. mecab-dic 설치
wget https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/mecab-ko-dic-2.1.1-20180720.tar.gz
tar xvfz mecab-ko-dic-2.1.1-20180720.tar.gz
cd mecab-ko-dic-2.1.1-20180720
./configure
make
sudo make install
./configure: line 1836: syntax error near unexpected token `mecab-ko-dic,'
./configure: line 1836: `AM_INIT_AUTOMAKE(mecab-ko-dic, 2.0.0)'
에러 발생 시
./autogen.sh
make
sudo make install
3. mecab-python 설치
git clone https://bitbucket.org/eunjeon/mecab-python-0.996.git
cd mecab-python-0.996
python setup.py build
python setup.py install
3. Mecab 사용해보기
- 만약 설치한 뒤에도 다음과 같은 에러가 난다면 pip를 이용해 mecab-python3를 설치해줍니다.
NameError: name 'Tagger' is not defined
pip3 install mecab-python3
설치 후 실행 결과
from konlpy.tag import Mecab
tokenizer = Mecab()
print(tokenizer.morphs('메캡 설치 완료'))
728x90
LIST
'Python > Data Engineering' 카테고리의 다른 글
한국어 문장 분리기 (kss - korean sentence splitter) 사용방법 (0) | 2023.02.10 |
---|---|
문자열 중간 다중 공백 제거하는 방법 (0) | 2023.01.28 |
py-hanspell을 이용한 네이버 맞춤법 검사기 (2) | 2023.01.24 |
KoNLPy를 활용한 한국어 형태소 분석기 비교 (0) | 2023.01.24 |
정규식을 이용한 데이터 전처리(문자만 남기기) (0) | 2023.01.14 |