Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Fix] Vector Search & LLM Prompt 성능 개선 #24

Merged
merged 2 commits into from
Oct 10, 2024
Merged

[Fix] Vector Search & LLM Prompt 성능 개선 #24

merged 2 commits into from
Oct 10, 2024

Conversation

semnisem
Copy link
Member

@semnisem semnisem commented Oct 10, 2024

PR 타입

  • 버그 수정
  • 성능 개선

반영 브랜치

dev ➡️ main

작업 사항

📝벡터 검색 결과 정확도 필터링

벡터 검색 결과에 대한 confidency(정확도)의 radius와 range를 설정하여 지정된 정확도 범위 내 결과만을 반환하도록 수정했습니다. 너무 낮은 정확도를 가지는 경우 LLM의 context로 처리할 수 없도록 했습니다.

📝검색 결과 문서 갯수 감축

너무 긴 input은 llm의 긴 응답 시간을 초래하므로 문서 개수를 3개에서 2개로 감소시켰습니다.

📝LLM 프롬프팅

너무 긴 응답을 하고 있어 가독성을 해치는 문제점을 해소하기 위해서 답변 분량을 제한하였습니다.

테스트 방법

추가된 기능은 아래 방식으로 자유롭게 요청&응답 테스트가 가능합니다.

  • Dev/Prod 서버 Postman
  • Dev/Prod 서버 Swagger UI
  • 깃허브 액션은 실행하지 말고, 로그를 확인합니다.

테스트 결과

답변 시간은 30%정도 단축되었으며, 아래와 같이 향상된 가독성을 보였습니다.

문항 이미지 변경 전 변경 후
image image image

연관성 판단
답변 내용 단축
검색 정확도 범위를 search_param에 지정
@semnisem semnisem added enhancement New feature or request fix All is working well labels Oct 10, 2024
@semnisem semnisem requested a review from KiSeungMin October 10, 2024 10:04
@semnisem semnisem self-assigned this Oct 10, 2024
@semnisem semnisem merged commit 743d81a into main Oct 10, 2024
2 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request fix All is working well
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant