안녕하세요. turbovec/TurboQuant 기반으로 constrained RAG용 graph memory layer를 붙인 turbo-graph를 만들었습니다.
turbovec은 flat top-k나 cheap allowlist가 있는 경우에 이미 좋습니다. 그런데 실제 RAG에서는 쿼리가 자주 이런 모양이 됩니다.
tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates
이 조합을 매번 Python/SQL/app layer에서 만들고, 다시 vector search에 넘기고, 결과를 graph/BM25와 rerank하고, 왜 이런 결과가 나왔는지 explain하는 코드가 반복되더라고요.
turbo-graph는 turbovec-compatible core는 유지하고, 그 주변의 graph/metadata view compilation, cache reuse, graph rerank, explain telemetry를 인덱스 레이어로 옮겨보는 실험입니다.
아직 Alpha라서 production에 바로 쓰라는 목적보다는, 실제 RAG route에서 어떤 API가 필요한지 피드백을 받고 싶습니다.

1 hour ago
2








English (US) ·