fisa06-team-binary

🔍 AI 기반 하이브리드 검색 및 RAG 파이프라인 최적화 랩

"정확하지만 좁은 BM25, 넓지만 느슨한 Vector Search. 이 둘을 어떻게 안정적으로 통합할 것인가?"

단순한 텍스트 매칭(Lexical)이나 문맥 검색(Semantic) 단일 구조의 한계를 극복하기 위해,
'데이터 필터링 - 하이브리드 검색 - LLM 검증'으로 이어지는 아키텍처를 설계하고 성능을 최적화한 프로젝트 시리즈입니다.

각 Phase별 상세한 엔지니어링 과정과 트러블슈팅은 아래 레포지토리에서 확인하실 수 있습니다.

Phase	Project	Core Engineering	Link
Phase 1	오답률 0% 하이브리드 RAG 파이프라인	`ChromaDB`, `Metadata Filtering`, `LLM Re-ranking`	➡️ Phase 1 Repository
Phase 2	금융 고객 타겟팅 (RRF 하이브리드 검색)	`SQL Hard Filter`, `BM25`, `Dense Vector`, `RRF 융합`	➡️ Phase 2 Repository
Phase 3	주식 종목 AI 탐색기 (Elasticsearch)	`Elasticsearch 8.x`, `Query Expansion(LLM)`	➡️ Phase 3 Repository

Problem: 전체 데이터를 대상으로 하이브리드/AI 연산 수행 시 시스템 병목 발생
Solution: 검색 엔진 앞단에 SQL 하드 필터링 배치
Impact: 초기 모수 10,000건 중 94.4%의 불필요한 연산을 0.00ms 단위로 차단, 총 응답 시간을 16.69ms에서 4.93ms로 단축 (약 3.3배 향상)

Problem: 스케일이 다른 BM25와 Vector 엔진을 단순 가중합(Score Fusion)할 경우 발생하는 순위 왜곡 및 운영 불안정성
Solution: 점수 스케일에 독립적인 순위 기반 융합(RRF, Reciprocal Rank Fusion) 도입
Impact: '외식 소비가 많은 고객' 시나리오에서 엔진 간 편향을 차단하고 실제 VIP 고과금 유저 추출 성공. 정답 검출률(Recall@10) 기존 대비 약 7배 향상