Candies AI · Retrieval Augmented
混合检索可验证引用实时索引Agentic
Candies RAG
十亿级向量 · 混合检索 · 可验证 Grounding
Candies RAG 以稀疏-稠密混合索引、多模态分块与引用完整性链,在 HotpotQA、企业 KB 与法务发现场景实现 faithfulness 与延迟双领先;Agentic RAG 闭环规划—检索—工具—验证。

核心指标
0
召回@10
0
幻觉率
0
检索通道
0
索引更新
Retrieval
混合检索栈
向量、关键词与图谱统一编排,可视化调试每一跳召回与融合权重,并与 Candies LLM 生成栈共享 rerank 与策略版本。

Candies 混合检索在同一 DAG 中编排查询改写、稠密 HNSW、稀疏 BM25 与知识图谱子图遍历:三路并行召回后学习排序融合,召回@10 公开摘要 0.89。ACL 在索引层强制,违规检索 0;P99 延迟 28ms,十亿级向量 QPS 可水平扩展。
多路召回
HNSW 稠密、BM25 稀疏与实体子图遍历并行;多模态块(图文表)映射同一嵌入空间,召回 96.1%。查询改写与 HyDE 可选,热词与业务词典分钟级生效。
融合重排
Cross-encoder 与 LLM rerank 级联;业务权重(时效、权威域、租户标签)可热更新。召回@10 较纯向量基线提升约 24%,融合 DAG 在控制台逐步回放。
语义缓存与成本
重复问题命中语义缓存,降低 LLM 调用成本(摘要 0.38×/千次)。缓存键绑定索引版本与 ACL 快照,避免权限变更后的陈旧答案泄漏。
Capabilities
核心能力矩阵
混合检索
稠密 HNSW + 稀疏 BM25 + 图谱三通道融合,召回@10 提升约 24%,P99 28ms。查询改写与融合 DAG 可可视化调试,十亿级分片水平扩展。
可验证引用
段落级锚点、完整性链与 citation bundle;Faithfulness 98.9%,幻觉率案例可至 0.06%。监管与法务抽检一键导出溯源包。
Agentic RAG
计划—检索—工具—验证闭环,多跳成功率 81%。轨迹按请求 ID 回放;运维 Agent 案例 MTTR 9 min、误操作 0。
重排序
Cross-encoder 与 LLM rerank 级联,业务权重(时效、权威域)热更新。与 Candies LLM 共用 rerank 策略版本,避免训练—服务口径分裂。
知识更新
增量索引与版本 diff,流式摄入 TTD <1s。CDC 驱动实时同步,索引变更自动失效语义缓存与相关答案。
多租户隔离
向量与元数据命名空间硬隔离,ACL 违规检索 0。租户级策略模板、配额与审计日志;私有化 air-gap 索引可选。
Architecture
RAG 全栈

分块、索引、混合检索、重排、Grounding 验证与引用发射分层透明:企业知识湖 ACL 护盾贯穿 ingest 到回答,流式摄入索引 TTD <1s。Agent 轨道实现计划—检索—工具—验证闭环,与 /ai/llm、/ai/nlp 共用 Tokenizer 与策略引擎,避免「检索一套、生成另一套」的口径分裂。
混合索引
稀疏 BM25 + 稠密 HNSW + 可选图谱边,十亿级分片;多租户命名空间硬隔离。增量索引与版本 diff 分钟级生效,CDC 驱动实时波纹同步。
引用验证
Grounding Lab 自动生成引用块并校验完整性链;Faithfulness 98.9%。法务 eDiscovery 引用准确率 100%,投行研报 8 min/份 vs 人工 4h。
Agent 轨道
Agentic RAG 多步规划可审计回放;多跳成功率 81%。云厂商运维 Agent 结合 Runbook 与日志,MTTR 9 min,误操作 0。
Roadmap
技术路线图
Candies RAG 公开路线图:企业版 GA、亚秒级实时索引、多模态 Beta、评测 harness 开放与法务 eDiscovery 合规包。
- 产品化进行中2026-Q2
Candies RAG 企业版 GA
混合检索栈、Grounding Lab 与 Agentic 轨道 GA;企业控制台支持多租户索引、ACL 策略与 faithfulness 仪表盘。OpenAI 兼容问答 API + gRPC,私有化 Helm 与 /ai/llm 生成栈同一策略版本号。

- 平台已完成2026-Q1
流式摄入 · 亚秒索引 TTD
CDC/流式管道驱动增量索引,更新 TTD <1s(较 LangChain 5min、SaaS 30s 级)。工单与客服知识库变更秒级可见,避免「刚改文档仍答旧版」投诉。

- 产品进行中2026-Q3
多模态 RAG Beta
图文表统一分块与嵌入,多模态召回 96.1%;扫描件 OCR 与表格结构保留进入同一 ACL 边界。制造、医疗与投行尽调客户可申请 Beta API。

- 生态进行中2025-Q4
评测 harness 240+ 集开放
公开摘要 240+ 评测集覆盖 faithfulness、多跳与行业私有模板;PoC 交付标准 faithfulness 报告。未过 harness 的索引/提示词构建自动阻断发布列车。

- 合规规划中2026-Q4
法务 eDiscovery 合规包
千万页级沉淀检索、引用 bundle 导出与律师抽检工单模板;案例召回 99.4%、引用 100%。满足跨境数据驻留与 air-gap 索引选项。

Comparison
行业对照
| 指标 | Candies | LangChain | LlamaIndex |
|---|---|---|---|
| 召回@10 | 0.89领先 | 0.71 | 0.74 |
| 答案可信度 | 0.94领先 | 0.78 | 0.80 |
| 索引延迟 | 45s领先 | 8min | 6min |
| 多跳成功率 | 81%领先 | 58% | 61% |
| 引用准确率 | 96.2%领先 | 82.0% | 84.1% |
| 租户隔离 | 硬隔离领先 | 软隔离 | 软隔离 |
| Agent 步数 | 6.2 均 | 不可控 | 不可控 |
| 成本/千次 | 0.38× | 1.0× | 0.92× |
Use cases
应用场景
可信问答

企业知识湖
PB 级文档、工单与规程统一索引,ACL 护盾在分簇层强制执行,违规检索 0。亚秒 P99 28ms,适合内网问答、运维 Runbook 与集团制度库;与 Candies NLP 摘要报表联动。

可验证引用
每句答案绑定段落 hash 与源版本,完整性链锁防篡改。Faithfulness 98.9%,投行研报 8 min/份;监管抽查一键导出 citation bundle。

多模态 RAG
扫描 PDF、幻灯片与表格统一嵌入,召回 96.1%。尽调、医疗影像报告与工程图纸可同库检索,权限标签随块传播。
运营与评测

实时索引
流式摄入驱动增量索引,TTD <1s;知识库变更秒级生效。客服与运维场景避免陈旧答案,索引版本与缓存键自动失效联动。

Agentic RAG
计划—检索—工具—验证四步闭环,多跳成功率 81%。云运维 Agent 案例 MTTR 9 min、误操作 0;轨迹按请求 ID 可审计回放。

评测 harness
240+ 金标集自动回归 faithfulness、coverage 与引用准确率;未达标构建阻断上线。PoC 标配 faithfulness 报告,研发与业务共用口径。
Case studies
产业案例

法务
跨国律所电子发现
顶级律所千万页诉讼材料接入 Candies RAG:混合检索 + Grounding 引用 bundle,律师审阅周期从 6 个月压缩至 2 周,召回 99.4%、引用准确率 100%。
- 之前
- 人工审阅约 6 个月/重大案件,检索遗漏风险高
- 之后
- 2 周交付可引用证物清单,监管抽查通过
- 99.4% 证据召回
- 100% 引用准确率

互联网
Tier-1 客服 Grounding 中枢
全球 SaaS 客服队列接入企业知识湖与实时索引:幻觉率 0.06%,首次解决率从 42% 升至 81%,CSAT +18;答案附可点击引用块,质检抽检效率提升 3×。
- 之前
- 首次解决 42%,幻觉投诉周报 200+
- 之后
- 首次解决 81%,幻觉率 0.06%
- 0.06% 幻觉率
- +18 CSAT

金融
投行研报合规问答
80 TB 研报库可审计问答:每句绑定研报段落与发布日期,监管抽查全程通过。人工摘录从 4h/份降至 8 min/份,与 Candies LLM 共用策略与水印版本。
- 之前
- 分析师人工摘录 4h/份,合规复核瓶颈
- 之后
- 8 min/份初稿 + 引用复核,抽查通过
- 通过 监管抽查
- 80 TB 库容

云计算
云厂商运维 Agentic RAG
Runbook、变更单与实时日志联合 Agent:多步检索定位根因并执行修复脚本,MTTR 45 min → 9 min,自动修复率 62%,误操作 0,轨迹可回放。
- 之前
- MTTR 45 min,Runbook 与日志分散
- 之后
- MTTR 9 min,Agent 轨迹审计
- 62% 自动修复率
- 0 误操作
R&D pillars
研发优势

Candies Retrieve · 混合检索
稠密 + 稀疏 + 图谱
三路召回与学习排序融合,召回@10 0.89,P99 28ms。查询改写、HyDE 与业务权重热更新在同一 DAG 可视化;十亿级向量水平分片,ACL 索引层硬隔离。
0.89
召回@10
28 ms
P99 延迟
96.1%
多模态召回
+24%
召回提升
- BM25+HNSW+子图并行,较纯向量 SaaS 召回@10 提升约 24%
- 语义缓存绑定索引版本与 ACL 快照,千次成本约 0.38×
- Cross-encoder + LLM rerank 级联,与 Candies LLM 策略同源

Candies Ground · 可验证 Grounding
引用链 · Faithfulness 98.9%
段落锚点、完整性链与 240+ harness 回归;幻觉率案例可至 0.06%。法务/金融 citation bundle 满足监管抽检,未过 faithfulness 门禁的构建阻断发布。
98.9%
Faithfulness
96.2%
引用准确率
0
ACL 违规
240+
评测集
- 完整性链锁检测源文档滚动更新与篡改
- 对抗集周更进入红队回归,与 LLM 输出水印联动
- 人工抽检工单与模型卡片版本自动关联

Candies Agentic · 多跳与运营
计划—检索—工具—验证
Agentic 轨道多跳成功率 81%,运维案例 MTTR 9 min。实时索引 TTD <1s;轨迹不可变日志支持事故复盘与合规审计,工具调用参数可回放。
81%
多跳成功率
< 1s
索引 TTD
9 min
MTTR 案例
62%
自动修复
- 检索计划 DSL 可配置业务护栏,阻断高风险工具组合
- 流式 CDC 索引与语义缓存失效联动,杜绝陈旧答案
- 与 /ai/nlp 企业搜索、/ai/llm 生成共用租户与策略引擎
Grounding
Grounding 实验室
可验证引用与幻觉评测一体,让「有据可查」从文案变为可度量、可审计的工程指标。

Grounding Lab 将引用块生成、完整性链校验、对抗集回归与人工抽检纳入发布闸门:Faithfulness 98.9%,引用准确率 96.2%,客服场景幻觉率可压至 0.06%。Agentic 轨迹(计划—检索—工具—验证)可按请求 ID 回放,满足金融、法务与监管抽检。
引用锚点与完整性链
段落级 hash、页码/行号与源文档版本绑定;答案每句可跳转原文。完整性链锁检测篡改与滚动更新冲突,监管抽查可导出 citation bundle。
Faithfulness 评测 harness
240+ 公开与行业金标集(含 HotpotQA 风格多跳);Faithfulness、coverage、引用准确率自动打分。未过回归的提示词/索引构建阻断上线,与 LLM 策略版本联动。
Agentic 轨迹审计
多步检索计划、工具调用参数与中间观察写入不可变日志;误操作率案例 0。运维 Runbook+日志联合 Agent MTTR 从 45min 降至 9min,自动修复率 62%。
FAQ