Skip to content

Latest commit

 

History

History
38 lines (24 loc) · 2.71 KB

hybrid-search.md

File metadata and controls

38 lines (24 loc) · 2.71 KB

Hybrid Search

  • Semantic search(의미 검색)

    • 사용자의 질문이 정확한 키워드와 직접적으로 관련되지 않더라도 사람처럼 사용자의 질문을 이해할 수 있기 때문에 널리 사용됩니다.
      • 사용자의 질문은 때로는 질문의 keyword와 직접적으로 연관되지 않을수 있습니다. 예) "이 영화 재미있어요?"라는 질문은 영화의 리뷰, 평점에 대한 콘텐츠를 제공해달라는 의미입니다.
      • 콘텐츠에 있는 답변과 직접적으로 관련되지 않은 사용자의 질문도 이해할 수 있습니다.
    • 텍스트의 의미를 표현하는 데 사용되는 워드 임베딩의 품질에 의존적입니다.
    • 의미 검색 기능을 통해 데이터의 의미적 의미를 기반으로 다국어 및 다중 모드 검색이 가능하고 오타일때에도 어느정도 검색할 수 있습니다.
    • 때로는 핵심 키워드를 놓칠 수 있습니다.
    • 생성된 벡터 임베딩의 품질에 따라 달라지며 도메인 외 용어(out-of-domain terms)에도 민감합니다.
  • Keyword search(단어 검색)

    • 정확한 키워드 일치 기능은 제품 이름이나 업계 전문 용어와 같은 특정 용어에 유용합니다.
    • 하지만, 오타와 동의어에 민감하여 중요한 문맥을 놓칠 수 있습니다.
  • 키워드 검색과 결합하면 다음과 같은 이점이 있습니다

    • 키워드 검색으로 직접적인 매칭 결과를 얻을 수 있습니다.
    • 의미 검색으로 키워드가 없더라도 관련된 의미 있는 결과를 얻을 수 있습니다.
    • 두 가지 검색 결과를 통합하여 더 포괄적이고 정확한 결과를 제공할 수 있습니다.

Knowledge Bases for Amazon Bedrock now supports hybrid search의 예제

질문 "What is the cost of the book "<book_name>" on <website_name>?"라는 질문을 검색했을때에 대해 아래와 같은 점을 생각할 수 있습니다. (적절한 예제가 아닐수도..)

  • In this query for a book name and website name, a keyword search will give better results, because we want the cost of the specific book.
  • However, the term “cost” might have synonyms such as “price,” so it will be better to use semantic search, which understands the meaning of the text.
  • Hybrid search brings the best of both approaches: precision of semantic search and coverage of keywords.

Improving Retrieval Performance in RAG Pipelines with Hybrid Search

Semantic 검색 방법

Keyword 검색 방법