You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
{{ message }}
This repository has been archived by the owner on Oct 14, 2021. It is now read-only.
기존의 용례 수집 방식은 속담이 언급되어 있는 문장만을 이용하려고했다. 이를 변경하려고 한다. 온갖 한글 문장 → 속담 언급 검색 가능 으로.
이렇게 변경하게 되면 속담이 언급되어 있지 않은 문장은 언급되어 있지 않은 대로의 가치가 그리고 언급되어 있다면 그대로의 가치가 있다.
WHAT?
이번에 시도하는 형태는 온갖 문장을 모두 수집하고 속담이 언급되어 있는 문장을 ES로 검색가능하게 하려고한다.
이떄, 속담의 변형형태도 가능하면 검색가능하게하려한다.
아니 논문에서는 그럴듯하게 적어놨길래, 자기들만의 분석기를 달아서 사용하는 줄 알았는데 기본 standard analyzer를 이용한다.
그러면 그냥 한글도 기본 nori analyzer를 이용하면 될거 같다.
심지어 analyzer가 적용되어 있는 proeprty도 sentence (예제)가 전부다. 나머지는 메타 정보처럼 제공됨. term-vector의 용도만 이해하면 될듯!
WHY?
기존의 용례 수집 방식은 속담이 언급되어 있는 문장만을 이용하려고했다. 이를 변경하려고 한다. 온갖 한글 문장 → 속담 언급 검색 가능 으로.
이렇게 변경하게 되면 속담이 언급되어 있지 않은 문장은 언급되어 있지 않은 대로의 가치가 그리고 언급되어 있다면 그대로의 가치가 있다.
WHAT?
이번에 시도하는 형태는 온갖 문장을 모두 수집하고 속담이 언급되어 있는 문장을 ES로 검색가능하게 하려고한다.
이떄, 속담의 변형형태도 가능하면 검색가능하게하려한다.
이는 이 논문 (idiometry)를 참고한다. 해당 논문에서 공개한 리포도 참고. 해당 논문에서 사용한 ES endpoint도 참고하자.
TODOs?
The text was updated successfully, but these errors were encountered: