[Fix] Vector Search & LLM Prompt 성능 개선 #24
Merged
Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
PR 타입
반영 브랜치
dev ➡️ main
작업 사항
📝
벡터 검색 결과 정확도 필터링
벡터 검색 결과에 대한 confidency(정확도)의 radius와 range를 설정하여 지정된 정확도 범위 내 결과만을 반환하도록 수정했습니다. 너무 낮은 정확도를 가지는 경우 LLM의 context로 처리할 수 없도록 했습니다.
📝
검색 결과 문서 갯수 감축
너무 긴 input은 llm의 긴 응답 시간을 초래하므로 문서 개수를 3개에서 2개로 감소시켰습니다.
📝
LLM 프롬프팅
너무 긴 응답을 하고 있어 가독성을 해치는 문제점을 해소하기 위해서 답변 분량을 제한하였습니다.
테스트 방법
추가된 기능은 아래 방식으로 자유롭게 요청&응답 테스트가 가능합니다.
테스트 결과
답변 시간은 30%정도 단축되었으며, 아래와 같이 향상된 가독성을 보였습니다.