반응형

https://www.youtube.com/watch?v=ckHAvm-L6Sc

 

 

 

cosine similarity만 했을 때: 45%

→ prompt engineering + tool use + query expansion: 98%

(Openai 입장)


가장 좋은 RAG 모듈은?

→ 문서에 따라 달라진다.

 

 

  • 한국어 금융 문서에서는 BM25가 5배가 더 좋음
  • 한국 대학교 학칙에서는 VectorDB(일반 cos. similarity)가 4.5배 더 좋음

추천 retriever: BM25

(llamaIndex BM25를 뜯어보면 한국어는 잘 나올 수가 없음

대신에 한국어 형태소 분석기를 적용하면 한국어도 잘됨

elasticsearch에서도 BM25가 있고, 한국어 형태소도 같이 쓰는 방법도 있음)

한국어 잘하기 위해서는 한국어 Embedding model을 반드시 사용해야할까?

Embedding model 성능이 한국어에서 좋으면 좋으나,

딱히 성능이 잘 안나올 때는 BM25가 더 좋을 수 있다.

반응형

+ Recent posts