跳到主要内容
Candies
跳到主要内容

Candies AI · Foundation Model R&D

MoE 预训练可验证对齐评测 harness推理编译

Candies LLM R&D

从预训练到对齐评测的一体化基础模型研发平台

Candies LLM 研发平台覆盖语料合成、万亿 MoE 预训练、SFT·RLHF 对齐、开放基准 harness 与推理编译全链路;与 Candies DL 万卡集群深度互联,应用能力仅以精选案例呈现。

Candies 大模型研发神经网络主视觉

核心指标

  • 0

    MFU

  • 0

    推理吞吐

  • 0

    上下文

  • 0

    栈自主率

Capabilities

核心能力矩阵

  • 预训练与缩放

    Candies LLM 在「预训练与缩放」方向将 Chinchilla+ 风格三轴联合搜索,MFU 58% 与收敛步数 -22% 实测。 支持私有化部署、策略护栏与全链路可观测;基准评测与线上 A/B 共用同一套指标口径,便于研发与业务对齐验收标准。

  • 对齐与 RLHF

    Candies LLM 在「对齐与 RLHF」方向将 宪法 AI + 人类偏好双轨,违规率万分级且可回放策略决策。 支持私有化部署、策略护栏与全链路可观测;基准评测与线上 A/B 共用同一套指标口径,便于研发与业务对齐验收标准。 版本迭代与训练数据治理纳入同一发布列车。

  • 推理编译

    Candies LLM 在「推理编译」方向将 PagedAttention、投机解码与 EP 并行,吞吐 3.2× 较基线。 支持私有化部署、策略护栏与全链路可观测;基准评测与线上 A/B 共用同一套指标口径,便于研发与业务对齐验收标准。 版本迭代与训练数据治理纳入同一发布列车。

  • Tokenizer 自研

    Candies LLM 在「Tokenizer 自研」方向将 多语 BPE 与代码/数学专用子词表,压缩率优于 SentencePiece 8%。 支持私有化部署、策略护栏与全链路可观测;基准评测与线上 A/B 共用同一套指标口径,便于研发与业务对齐验收标准。

  • MoE 路由

    Candies LLM 在「MoE 路由」方向将 专家负载均衡 1.08,热迁移与通信重叠。 支持私有化部署、策略护栏与全链路可观测;基准评测与线上 A/B 共用同一套指标口径,便于研发与业务对齐验收标准。 版本迭代与训练数据治理纳入同一发布列车。

  • 评测与门禁

    Candies LLM 在「评测与门禁」方向将 公开+私有基准同一仪表盘,发布列车阻断未达标构建。 支持私有化部署、策略护栏与全链路可观测;基准评测与线上 A/B 共用同一套指标口径,便于研发与业务对齐验收标准。 版本迭代与训练数据治理纳入同一发布列车。

Architecture

LLM 研发流水线

Candies LLM 研发流水线架构

语料—Tokenizer—预训练—SFT—RLHF—评测—推理编译七段可观测。

  • 数据与 Tokenizer

    多模态语料配比与词表实验平台。

  • 对齐与评测

    偏好学习与 harness 同源指标。

  • 推理交付

    与 DL 集群共享 placement 与 MFU 看板。

Comparison

行业对照

Candies LLM 行业指标对照
指标CandiesGPT-5Claude 4
MMLU92.8%领先88.5%87.9%
HumanEval91.2%领先84.0%85.1%
推理延迟 P9938 ms领先95 ms88 ms
MFU@8k GPU58%领先41%44%
对齐违规0.02%领先0.15%0.12%
128k 困惑度2.1领先2.82.7
MoE 负载差1.081.381.32
TCO/百万 token0.39×1.0×0.94×

Use cases

应用场景

研发场景

  • MoE 预训练

    万亿 MoE 预训练

    专家门控与损失地貌联合优化。

  • 对齐实验室

    SFT·RLHF 实验室

    偏好锥与奖励模型棱镜标定。

  • 合成数据工厂

    合成数据工厂

    种子裂变与去污染滤网。

评测与推理

  • 评测 harness

    评测 harness

    千项基准齐射 checkpoint。

  • 长上下文研究

    长上下文 R&D

    公里级文档穿过记忆 lattice。

  • 推理优化研发

    推理优化 R&D

    量化晶格与投机 ghost token。

Case studies

产业案例

  • 国家实验室联合训练

    科研

    国家级 AI 实验室联合训练

    共享 checkpoint 巨石与联合治理。

    之前
    孤立实验
    之后
    统一 harness
    • 57% MFU
    • 12 协作机构
  • 开源权重发布

    开源

    开源旗舰权重发布

    模型卡、评测报告与分级 API。

    之前
    不可复现
    之后
    完整复现包
    • 2.1M 下载周
    • 240+ 基准项
  • 超算 MoE

    超算

    超算中心万亿 MoE 驻场

    与 DL 页共享万卡队列。

    之前
    MFU 39%
    之后
    MFU 58%
    • 24k GPU
    • 8T/月 Tokens
  • 监管沙箱

    监管

    监管沙箱对齐审计

    红队—修复闭环可验证。

    之前
    抽检 2 周
    之后
    实时 24h
    • 0.02% 违规率
    • 100% 审计通过

FAQ

常见问题

平台

训练

推理

合规

生态

R&D toolkit

研发工作台

预训练、对齐、数据、评测与推理优化五类工具矩阵,覆盖基础模型研发全链路。

预训练

万亿 MoE 预训练编排

专家并行拓扑与数据配比实验矩阵。

预训练

多模态语料配比实验

图文音统一配比与消融追踪。

微调与对齐

SFT 课程学习流水线

难度递增样本与遗忘抑制。

微调与对齐

RLHF / DPO 对齐沙箱

偏好数据与奖励模型版本治理。

数据工程

合成数据与去污染

种子裂变、近重复与许可审查。

数据工程

长上下文切片与打分

质量模型与记忆热点标注。

评测与观测

开放基准一键评测

240+ 基准与回归门禁。

评测与观测

训练/推理全链路追踪

MFU、梯度范数与路由热力图。

推理优化

量化与投机解码

INT4/FP8 与 ghost token 实验台。

推理优化

MoE 专家路由压测

负载均衡与热点专家熔断。

Platform

训练平台模块

  • 实验与 Checkpoint 中枢

    W&B 级实验追踪、断点续训与权重版本治理。

    • 时间旅行对比
    • 自动归档
    • 跨团队共享
  • 分布式训练调度

    万卡作业队列、拓扑感知 placement,与 DL 集群互联。

    • 拓扑感知
    • 抢占恢复
    • 绿色电力优先
  • 对齐与安全实验室

    RLHF 沙箱、红队探针与策略约束可验证。

    • 红队剧本
    • 策略 DSL
    • 审计导出
  • 开放模型发布

    评测报告、模型卡与权重/API 分级发布。

    • 模型卡生成
    • 伦理披露
    • 分级 API

Industry

应用精选 · 产业验证

高价值行业示例,不作为主叙事重心。

  • 金融

    合规推理与审计可追溯

    监管沙箱内可验证推理链,满足穿透式审计。

  • 制造

    工艺知识库联合推理

    规程、图纸与代码跨模态问答,驻场私有化。

  • 政务

    公文与政策对齐生成

    主权云部署,政策库 grounding 与红头格式约束。

  • 科研

    论文辅助与假设生成

    文献 harness 与实验设计建议,强调可复现引用。

R&D pillars

研发优势

  • 缩放定律可视化

    缩放定律与效率

    算力-数据-参数联合最优

    MFU 与收敛稳定性行业领先,缩放律曲面实时拟合。

    • 58%

      MFU

    • -22%

      收敛步数

    • 三轴最优曲面可视化
    • 自适应 batch 与 LR
  • 全栈研发塔

    全栈自研

    Tokenizer 到推理引擎一体

    训练框架、对齐管线与推理编译器同源代码库。

    • 100%

      组件自主率

    • 单仓

      版本对齐

    • 统一 IR 下降
    • 专家路由融合算子
  • 安全对齐环

    安全对齐

    可验证对齐管线

    红队—策略—修复闭环,违规率 0.03% 以下。

    • 18k+

      红队探针

    • <24h

      修复 SLA

    • 策略 DSL 可执行
    • 偏好数据血缘
  • 开放科学束

    开放与复现

    基准可复现包

    模型卡、伦理披露与种子权重社区发布。

    • 240+

      基准覆盖

    • 99.2%

      复现率

    • 一键复现容器
    • 开放权重分级

Next steps

共建下一代基础模型

与国家实验室、超算中心及产业龙头联合研发。

本网站内容均为杜撰,如有雷同,不甚荣幸。
本中文文档采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 (CC BY-NC-SA 4.0) 进行许可。