[Elasticsearch] 사용자 사전 추가 (Elastic Cloud)

[원본 링크]

사용자 사전은 검색엔진에 있어 가장 중요하면서, 골치아픈 녀석 중 하나다.
이게 왜 필요하냐 하면...

일반적으로 제대로된 검색엔진에서 검색을 하면, 우리는 띄어쓰기를 하든 안하든간에 거의 유사한 결과를 얻기를 기대한다. 제대로된 띄어쓰기 처리를 해주려면 당연히 어디까지가 단어인줄 알아야 처리가 가능한데, 단어의 기준은 당연히 시스템마다 천차만별로 다를 것이다.

그냥 형태소분석기 아무거나 써도 기본적으로 국어사전에 있는 단어는 인식하겠지만, 사전에 없는 단어는 인식을 못하는 것이다. 신조어나 외래어나.. 뭐든간에.

이런걸 처리하기 위한 것이 사용자 사전이다.
사용자 사전의 형식은 개행으로 구분된 텍스트파일이면 된다.

만드는 방법은 거의 쌩노가다밖에 없다. 그래서 전문업체에 외주를 주기도 한다더라..

다음과 같이 텍스트파일을 만들어두면 된다.

이렇게

그리고 저걸 압축해서

elastic cloud의 Feature 탭에 들어가

Extension에 들어가서

익스텐션을 생성해준다.

이름이나 설명은 편한대로 지으면 되고,
버전은 사용하는 엘라스틱서치버전과 동일하게 맞춰줘야 한다. 아무거나 넣으면 인식을 못한다.
그리고 아까 압축한 파일을 올려주면 끝이다.

됐으면

Deployment Edit 페이지에 들어가서

Setting add Plugins 클릭

방금 만든 사전을 선택해서 저장하면 끝이다.

버전 아무거나 써넣었다가 시간 좀 버렸다.



참조
https://mingsigi.tistory.com/entry/ElasticStack-30-Elastic-Cloud-%EC%82%AC%EC%9A%A9%EC%9E%90-%EC%82%AC%EC%A0%84
https://stackoverflow.com/questions/53742091/upload-stopwords-and-synonyms-to-elasticsearch-could-server/53789652