Skip to content

아이스크림 오분석 이슈 #204

@Dokkabei97

Description

@Dokkabei97

안녕하세요

키위 0.21.0 으로 버전업 하고서 분석 결과를 테스트 중 일부 오분석 되는 이슈가 발견되어 공유드립니다.

from kiwipiepy import Kiwi

kiwi = Kiwi()
cong_kiwi = Kiwi(model_type='cong', model_path='/resources/model/cong-base')

print([token.form for token in kiwi.tokenize("세상에서 제일 부드러운 아이스크림")])
print([token.form for token in cong_kiwi.tokenize("세상에서 제일 부드러운 아이스크림")])
print([token.form for token in kiwi.tokenize("초콜릿 아이스크림은 맛있다")])
print([token.form for token in cong_kiwi.tokenize("초콜릿 아이스크림은 맛있다")])

실행 한다면 순서대로 아래와 같이 결과가 나옵니다.

['세상', '에서', '제일', '부드럽', '은', '아이스', '크림']
['세상', '에서', '제일', '부드럽', '은', '아이스크림']
['초콜릿', '아이스크림', '은', '맛있', '다']
['초콜릿', '아이스크림', '은', '맛있', '다']

'아이스크림'으로 끝이 나면 '아이스', '크림'으로 분리되어 오분석이 나지만 반대로 '아이스크림' 뒤에 아무 단어나 문장이 들어가면 그때는 문제없이 정상적으로 분석을 합니다.

Metadata

Metadata

Assignees

Labels

bugSomething isn't working

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions