Candies AI · Retrieval Augmented

混合检索可验证引用实时索引Agentic更新于 2026-05-21

Candies RAG

十亿级向量 · 混合检索 · 可验证 Grounding

Candies RAG 以稀疏-稠密混合索引、多模态分块与引用完整性链，在 HotpotQA、企业 KB 与法务发现场景实现 faithfulness 与延迟双领先；Agentic RAG 闭环规划—检索—工具—验证。

+24%
召回@10
-41%
幻觉率
3
检索通道
<1min
索引更新

Retrieval

混合检索栈

向量、关键词与图谱统一编排，可视化调试每一跳召回与融合权重，并与 Candies LLM 生成栈共享 rerank 与策略版本。

Candies 混合检索在同一 DAG 中编排查询改写、稠密 HNSW、稀疏 BM25 与知识图谱子图遍历：三路并行召回后学习排序融合，召回@10 公开摘要 0.89。ACL 在索引层强制，违规检索 0；P99 延迟 28ms，十亿级向量 QPS 可水平扩展。

多路召回
HNSW 稠密、BM25 稀疏与实体子图遍历并行；多模态块（图文表）映射同一嵌入空间，召回 96.1%。查询改写与 HyDE 可选，热词与业务词典分钟级生效。
融合重排
Cross-encoder 与 LLM rerank 级联；业务权重（时效、权威域、租户标签）可热更新。召回@10 较纯向量基线提升约 24%，融合 DAG 在控制台逐步回放。
语义缓存与成本
重复问题命中语义缓存，降低 LLM 调用成本（摘要 0.38×/千次）。缓存键绑定索引版本与 ACL 快照，避免权限变更后的陈旧答案泄漏。

Capabilities

核心能力矩阵

混合检索
稠密 HNSW + 稀疏 BM25 + 图谱三通道融合，召回@10 提升约 24%，P99 28ms。查询改写与融合 DAG 可可视化调试，十亿级分片水平扩展。
可验证引用
段落级锚点、完整性链与 citation bundle；Faithfulness 98.9%，幻觉率案例可至 0.06%。监管与法务抽检一键导出溯源包。
Agentic RAG
计划—检索—工具—验证闭环，多跳成功率 81%。轨迹按请求 ID 回放；运维 Agent 案例 MTTR 9 min、误操作 0。
重排序
Cross-encoder 与 LLM rerank 级联，业务权重（时效、权威域）热更新。与 Candies LLM 共用 rerank 策略版本，避免训练—服务口径分裂。
知识更新
增量索引与版本 diff，流式摄入 TTD <1s。CDC 驱动实时同步，索引变更自动失效语义缓存与相关答案。
多租户隔离
向量与元数据命名空间硬隔离，ACL 违规检索 0。租户级策略模板、配额与审计日志；私有化 air-gap 索引可选。

Architecture

RAG 全栈

分块、索引、混合检索、重排、Grounding 验证与引用发射分层透明：企业知识湖 ACL 护盾贯穿 ingest 到回答，流式摄入索引 TTD <1s。Agent 轨道实现计划—检索—工具—验证闭环，与 /ai/llm、/ai/nlp 共用 Tokenizer 与策略引擎，避免「检索一套、生成另一套」的口径分裂。

混合索引
稀疏 BM25 + 稠密 HNSW + 可选图谱边，十亿级分片；多租户命名空间硬隔离。增量索引与版本 diff 分钟级生效，CDC 驱动实时波纹同步。
引用验证
Grounding Lab 自动生成引用块并校验完整性链；Faithfulness 98.9%。法务 eDiscovery 引用准确率 100%，投行研报 8 min/份 vs 人工 4h。
Agent 轨道
Agentic RAG 多步规划可审计回放；多跳成功率 81%。云厂商运维 Agent 结合 Runbook 与日志，MTTR 9 min，误操作 0。

Roadmap

技术路线图

Candies RAG 公开路线图：企业版 GA、亚秒级实时索引、多模态 Beta、评测 harness 开放与法务 eDiscovery 合规包。

产品化进行中2026-Q2
Candies RAG 企业版 GA
混合检索栈、Grounding Lab 与 Agentic 轨道 GA；企业控制台支持多租户索引、ACL 策略与 faithfulness 仪表盘。OpenAI 兼容问答 API + gRPC，私有化 Helm 与 /ai/llm 生成栈同一策略版本号。
平台已完成2026-Q1
流式摄入 · 亚秒索引 TTD
CDC/流式管道驱动增量索引，更新 TTD <1s（较 LangChain 5min、SaaS 30s 级）。工单与客服知识库变更秒级可见，避免「刚改文档仍答旧版」投诉。
产品进行中2026-Q3
多模态 RAG Beta
图文表统一分块与嵌入，多模态召回 96.1%；扫描件 OCR 与表格结构保留进入同一 ACL 边界。制造、医疗与投行尽调客户可申请 Beta API。
生态进行中2025-Q4
评测 harness 240+ 集开放
公开摘要 240+ 评测集覆盖 faithfulness、多跳与行业私有模板；PoC 交付标准 faithfulness 报告。未过 harness 的索引/提示词构建自动阻断发布列车。
合规规划中2026-Q4
法务 eDiscovery 合规包
千万页级沉淀检索、引用 bundle 导出与律师抽检工单模板；案例召回 99.4%、引用 100%。满足跨境数据驻留与 air-gap 索引选项。

Comparison

行业对照

Candies RAG 行业指标对照
指标	Candies	LangChain	LlamaIndex
召回@10	0.89领先	0.71	0.74
答案可信度	0.94领先	0.78	0.80
索引延迟	45s领先	8min	6min
多跳成功率	81%领先	58%	61%
引用准确率	96.2%领先	82.0%	84.1%
租户隔离	硬隔离领先	软隔离	软隔离
Agent 步数	6.2 均	不可控	不可控
成本/千次	0.38×	1.0×	0.92×

Use cases

应用场景

可信问答

企业知识湖
PB 级文档、工单与规程统一索引，ACL 护盾在分簇层强制执行，违规检索 0。亚秒 P99 28ms，适合内网问答、运维 Runbook 与集团制度库；与 Candies NLP 摘要报表联动。
可验证引用
每句答案绑定段落 hash 与源版本，完整性链锁防篡改。Faithfulness 98.9%，投行研报 8 min/份；监管抽查一键导出 citation bundle。
多模态 RAG
扫描 PDF、幻灯片与表格统一嵌入，召回 96.1%。尽调、医疗影像报告与工程图纸可同库检索，权限标签随块传播。

运营与评测

实时索引
流式摄入驱动增量索引，TTD <1s；知识库变更秒级生效。客服与运维场景避免陈旧答案，索引版本与缓存键自动失效联动。
Agentic RAG
计划—检索—工具—验证四步闭环，多跳成功率 81%。云运维 Agent 案例 MTTR 9 min、误操作 0；轨迹按请求 ID 可审计回放。
评测 harness
240+ 金标集自动回归 faithfulness、coverage 与引用准确率；未达标构建阻断上线。PoC 标配 faithfulness 报告，研发与业务共用口径。

Case studies

产业案例

法务
跨国律所电子发现
顶级律所千万页诉讼材料接入 Candies RAG：混合检索 + Grounding 引用 bundle，律师审阅周期从 6 个月压缩至 2 周，召回 99.4%、引用准确率 100%。
之前
人工审阅约 6 个月/重大案件，检索遗漏风险高
之后
2 周交付可引用证物清单，监管抽查通过
- 99.4% 证据召回
- 100% 引用准确率
互联网
Tier-1 客服 Grounding 中枢
全球 SaaS 客服队列接入企业知识湖与实时索引：幻觉率 0.06%，首次解决率从 42% 升至 81%，CSAT +18；答案附可点击引用块，质检抽检效率提升 3×。
之前
首次解决 42%，幻觉投诉周报 200+
之后
首次解决 81%，幻觉率 0.06%
- 0.06% 幻觉率
- +18 CSAT
金融
投行研报合规问答
80 TB 研报库可审计问答：每句绑定研报段落与发布日期，监管抽查全程通过。人工摘录从 4h/份降至 8 min/份，与 Candies LLM 共用策略与水印版本。
之前
分析师人工摘录 4h/份，合规复核瓶颈
之后
8 min/份初稿 + 引用复核，抽查通过
- 通过监管抽查
- 80 TB 库容
云计算
云厂商运维 Agentic RAG
Runbook、变更单与实时日志联合 Agent：多步检索定位根因并执行修复脚本，MTTR 45 min → 9 min，自动修复率 62%，误操作 0，轨迹可回放。
之前
MTTR 45 min，Runbook 与日志分散
之后
MTTR 9 min，Agent 轨迹审计
- 62% 自动修复率
- 0 误操作

R&D pillars

研发优势

Candies Retrieve · 混合检索
稠密 + 稀疏 + 图谱
三路召回与学习排序融合，召回@10 0.89，P99 28ms。查询改写、HyDE 与业务权重热更新在同一 DAG 可视化；十亿级向量水平分片，ACL 索引层硬隔离。
- 0.89
  召回@10
- 28 ms
  P99 延迟
- 96.1%
  多模态召回
- +24%
  召回提升
- BM25+HNSW+子图并行，较纯向量 SaaS 召回@10 提升约 24%
- 语义缓存绑定索引版本与 ACL 快照，千次成本约 0.38×
- Cross-encoder + LLM rerank 级联，与 Candies LLM 策略同源
Candies Ground · 可验证 Grounding
引用链 · Faithfulness 98.9%
段落锚点、完整性链与 240+ harness 回归；幻觉率案例可至 0.06%。法务/金融 citation bundle 满足监管抽检，未过 faithfulness 门禁的构建阻断发布。
- 98.9%
  Faithfulness
- 96.2%
  引用准确率
- 0
  ACL 违规
- 240+
  评测集
- 完整性链锁检测源文档滚动更新与篡改
- 对抗集周更进入红队回归，与 LLM 输出水印联动
- 人工抽检工单与模型卡片版本自动关联
Candies Agentic · 多跳与运营
计划—检索—工具—验证
Agentic 轨道多跳成功率 81%，运维案例 MTTR 9 min。实时索引 TTD <1s；轨迹不可变日志支持事故复盘与合规审计，工具调用参数可回放。
- 81%
  多跳成功率
- < 1s
  索引 TTD
- 9 min
  MTTR 案例
- 62%
  自动修复
- 检索计划 DSL 可配置业务护栏，阻断高风险工具组合
- 流式 CDC 索引与语义缓存失效联动，杜绝陈旧答案
- 与 /ai/nlp 企业搜索、/ai/llm 生成共用租户与策略引擎

Grounding

Grounding 实验室

可验证引用与幻觉评测一体，让「有据可查」从文案变为可度量、可审计的工程指标。

Grounding Lab 将引用块生成、完整性链校验、对抗集回归与人工抽检纳入发布闸门：Faithfulness 98.9%，引用准确率 96.2%，客服场景幻觉率可压至 0.06%。Agentic 轨迹（计划—检索—工具—验证）可按请求 ID 回放，满足金融、法务与监管抽检。

引用锚点与完整性链
段落级 hash、页码/行号与源文档版本绑定；答案每句可跳转原文。完整性链锁检测篡改与滚动更新冲突，监管抽查可导出 citation bundle。
Faithfulness 评测 harness
240+ 公开与行业金标集（含 HotpotQA 风格多跳）；Faithfulness、coverage、引用准确率自动打分。未过回归的提示词/索引构建阻断上线，与 LLM 策略版本联动。
Agentic 轨迹审计
多步检索计划、工具调用参数与中间观察写入不可变日志；误操作率案例 0。运维 Runbook+日志联合 Agent MTTR 从 45min 降至 9min，自动修复率 62%。

FAQ

常见问题

产品

技术

部署

Next steps

让回答有据可查

RAG 评测包与私有化索引顾问。

申请 RAG PoC
含 faithfulness 报告
了解更多
Candies LLM
生成与检索一体
了解更多

本网站内容均为杜撰，如有雷同，不甚荣幸。

社区指南行为规范

本中文文档采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 (CC BY-NC-SA 4.0) 进行许可。

Candies RAGRAG

核心指标

混合检索栈

多路召回

融合重排

语义缓存与成本

核心能力矩阵

混合检索

可验证引用

Agentic RAG

重排序

知识更新

多租户隔离

RAG 全栈

混合索引

引用验证

Agent 轨道

技术路线图

Candies RAG 企业版 GA

流式摄入 · 亚秒索引 TTD

多模态 RAG Beta

评测 harness 240+ 集开放

法务 eDiscovery 合规包

行业对照

应用场景

可信问答

企业知识湖

可验证引用

多模态 RAG

运营与评测

实时索引

Agentic RAG

评测 harness

产业案例

跨国律所电子发现

Tier-1 客服 Grounding 中枢

投行研报合规问答

云厂商运维 Agentic RAG

研发优势

Candies Retrieve · 混合检索

Candies Ground · 可验证 Grounding

Candies Agentic · 多跳与运营

Grounding 实验室

引用锚点与完整性链

Faithfulness 评测 harness

Agentic 轨迹审计

常见问题

产品

技术

部署

让回答有据可查

申请 RAG PoC

Candies LLM

Candies RAG