Show GN: turbo-graph – turbovec에 그래프 메모리/필터 캐시를 얹은 constrained RAG 인덱스

1 hour ago 2

안녕하세요. turbovec/TurboQuant 기반으로 constrained RAG용 graph memory layer를 붙인 turbo-graph를 만들었습니다.

turbovec은 flat top-k나 cheap allowlist가 있는 경우에 이미 좋습니다. 그런데 실제 RAG에서는 쿼리가 자주 이런 모양이 됩니다.

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

이 조합을 매번 Python/SQL/app layer에서 만들고, 다시 vector search에 넘기고, 결과를 graph/BM25와 rerank하고, 왜 이런 결과가 나왔는지 explain하는 코드가 반복되더라고요.

turbo-graph는 turbovec-compatible core는 유지하고, 그 주변의 graph/metadata view compilation, cache reuse, graph rerank, explain telemetry를 인덱스 레이어로 옮겨보는 실험입니다.

아직 Alpha라서 production에 바로 쓰라는 목적보다는, 실제 RAG route에서 어떤 API가 필요한지 피드백을 받고 싶습니다.

GitHub:
https://github.com/bigmacfive/turbo-graph

Read Entire Article