Not Diamond
免费
-
Not Diamond 提供多模型路由能力,帮助团队在质量、延迟和成本之间动态选择模型。
Not Diamond 工具正文
Not Diamond 的核心参数与统计
| 参数 | 当前公开信息 | 说明 |
|---|---|---|
| 产品定位 | 多模型路由层 | 在效果、成本、延迟间做动态平衡 |
| 交付形态 | API + 控制台 | 适配已有 LLM 应用栈 |
| 关键能力 | 路由、评估、策略控制 | 降低手工切模型成本 |
| 目标用户 | AI 应用团队、平台工程团队 | 强调生产环境可控性 |
| 官方文档 | Docs 站点 | https://docs.notdiamond.ai/ |
Not Diamond 的本质是“决策层”而不是“模型层”,价值在于把模型选择从人工经验变成可配置策略。
Not Diamond 的用户与市场认可
- 官网 FAQ 公开声称:使用 Not Diamond 的团队在 coding agent 工作负载下实现超过 30%+ 成本节省(官方宣称,非第三方独立审计结论)。
- 产品定位为路由层,不是网关——实际模型请求仍在客户端通过自己的网关执行,路由层仅负责推荐选型。
- 具体付费客户数量未公开。
Not Diamond 的成本优势
| 成本层 | 公开信息 | 实操含义 |
|---|---|---|
| C 端/个人 | 非主要面向对象 | 更偏团队与平台能力 |
| API/开发者 | 每月 10,000 次免费路由推荐 | 小规模项目路由成本很低 |
| 企业级 | 官网 FAQ 宣称超过 30%+ 成本节省 | 实际效果需内部指标体系控制才能被大规模复现 |
隐性收益是把模型选型从人工经验升级为可配置策略;隐性成本在于需要建设内部评估指标体系,否则路由策略很难稳定优化。
Not Diamond 的主要功能
- 模型路由:按任务特征把请求分发到更匹配的模型。
- 策略配置:可按质量、成本、延迟目标配置路由策略。
- 评估闭环:通过结果评估优化后续模型分配。
- 统一接入层:减少应用层直接绑定单一模型供应商。
Not Diamond 的模型与版本演进
| 阶段 | 时间 | 公开变化 |
|---|---|---|
| Prompt Optimization GA | 2026-01-20 | Prompt Optimization 正式一般可用,路由与提示词优化形成产品双主线 |
| Coding Agent ROI 方法论发布 | 2026-06-10 | 官方博客发布面向 coding agent 的 ROI 评估方法论,非产品版本,体现平台定位进化 |
| Routing API 公开 | 2024 | 核心路由 SDK 公开,支持 OpenAI、Anthropic 等主流模型间的路由推荐 |
Not Diamond 的技术优势
- 机制:路由层不拦截模型请求,仅推荐选型;实际请求仌d客户端通过自己的网关执行,数据不经第三方。
效果:降低数据隐私风险,不需改变现有 LLM 调用架构。
适用场景:高数据敏感性企业或首先关注数据合规的团队。 - 机制:评估反馈驱动路由优化,实际接入后会根据执行结果持续调整路由策略。
效果:逐步逆込成本与质量平衡点,而不依赖人工选型经验。
适用场景:请求量大、指标敏感的在线应用。 - 机制:通过 SOC 2、ISO 27001 认证,支持 VPC 部署和 Zero Data Retention(ZDR)策略。
效果:企业客户可在合规框架内引入路由层,而不需另外建设内部安全机制。
适用场景:金融、医疗等对合规要求高的行业。
Not Diamond 的如何使用
| 入口 | 适用角色 | 推荐步骤 |
|---|---|---|
| 官网 | 产品与技术负责人 | 评估能力边界与接入方式 |
| Docs | 平台工程师 | 按文档配置路由策略与 API |
| 商务入口 | 企业采购 | 确认 SLA、合规与合同条款 |
建议先在一个单场景任务做 A/B,对比固定模型与路由策略的质量、成本、延迟差异。
Not Diamond 的产品定价
Pay-as-you-go(公开带量计费)
| 能力 | 免费额度 | 超出单价 |
|---|---|---|
| Intelligent Routing | 10,000 次/月 | $10 / 每额外 10,000 次 |
| Prompt Optimization | 10 次成功优化/月 | $20 / 每次额外成功优化 |
| Custom Routers | 3 个免费 | 按额外算 |
| 每次运行支持 Target Models | 4 个 | 固定额度 |
Enterprise (定制档)
| 内容 | 说明 |
|---|---|
| 价格 | 联系销售,暂无公开定价 |
| BYO Models | 支持自带自定义模型 |
| Priority API Queue | 优先队列位置 |
| Bulk Pricing | 规模优惠单价 |
| 合规认证 | SOC 2、ISO 27001、VPC 部署、ZDR 策略 |
Not Diamond 的应用场景
- 多模型生产应用:在不同任务间自动选择模型。
- 成本敏感型 AI 产品:用路由减少高价模型滥用。
- 平台化 AI 中台:统一治理多个模型供应商接入。
Not Diamond 的适用人群
- AI 平台工程团队:需要统一模型调用治理。
- 增长期产品团队:请求量上升后需要控成本。
- 企业技术负责人:希望降低单供应商绑定风险。
不适配边界:调用规模很小、模型策略长期不变的小型项目。
Not Diamond 的总结与展望
Not Diamond 适合多模型并行的中后期团队,能把模型选择从“人工经验”升级为“可配置策略”。产品定位明确为路由层而非网关,实际请求仍在客户内部执行。当前公开计费包含每月 10k 次免费路由推荐,多模型切换成本很低。企业级通过 SOC 2、ISO 27001、VPC 和 ZDR 策略为高合规性要求团队提供支撑。限制在于最终效果高度依赖内部评估指标体系的完善度。
参考来源
- https://www.notdiamond.ai/
- https://www.notdiamond.ai/pricing
- https://docs.notdiamond.ai/docs/what-is-not-diamond
- https://docs.notdiamond.ai/docs/quickstart-routing
- https://docs.notdiamond.ai/docs/prompt-optimization
- https://www.notdiamond.ai/blog
- https://www.notdiamond.ai/blog/prompt-optimization-is-now-generally-available
- https://www.notdiamond.ai/blog/how-to-measure-roi-in-coding-agents
版本信息
- Prompt Optimization 正式发布(GA) :Prompt Optimization 功能正式一般可用,路由与提示词优化形成产品双主线。
- Routing API 公开上线 :Not Diamond Routing API 公开,开发者可通过 SDK 进行多模型路由推荐。
用户评价