Vellum AI 免费

-

Vellum AI 是一套面向 LLM 应用工程化的 AI智能体 与开发平台,公开文档覆盖 Agent Builder、Prompts、Workflows、Evaluation、Deployments、Monitoring、Documents、Security 等模块;官网同时将新产品方向描述为个人 AI 助手与个人智能平台。

Vellum AI 产品界面

Vellum AI - LLM 应用工程化与个人智能平台

Vellum AI 的核心参数与统计

Vellum AI 早期更明确地面向“把 LLM 应用从原型带到生产”的工程化场景,官方文档仍在维护 Prompt、Workflow、Evaluation、Deployment、Monitoring 和 SDK 等能力;2026 年官网首页与定价页则把产品叙事扩展到 Personal Intelligence,强调个人 AI 助手、长期记忆、工具调用、桌面控制、自托管与云端运行。对本项目的工具收录而言,Vellum AI 更适合归入 AI Agent / LLM 应用开发平台,而不是单一聊天助手或单一 Prompt 编辑器。

参数 当前公开信息
官方入口 https://www.vellum.ai/
文档入口 https://docs.vellum.ai/product/getting-started/overview
核心定位 LLM 应用开发、Prompt/Workflow 管理、评测、部署、监控;官网同时主推 Personal AI Assistant
主要模块 Agent Builder、Prompts、Workflows、Evaluation & Test Suites、Deployments、Monitoring、Documents、Security
开发者能力 Client SDK、Workflows SDK、Prompt/Workflow API、Document Index API、Test Suite API
运行形态 Web 控制台、API、开源/自托管个人助手、Mac 下载入口
公司信息 YC W23;YC 页面显示总部为 New York,状态 Active
公开团队规模 YC 页面显示 Team Size 23;以 YC 页面实时信息为准
当前公开价格结构 个人助手官网定价页显示 Base/Pro、机器规格、存储与按需 credits;旧 LLM 平台企业套餐未公开完整价格

定位变化:Vellum AI 的公开材料存在两条产品线语义。docs.vellum.ai 仍是 LLM 应用工程平台文档,覆盖开发、测试、部署与监控;www.vellum.ai 主页和定价页则把“个人 AI 助手”放在第一层叙事。采购或技术选型时,应先确认团队需要的是开发平台能力、Workflows SDK,还是个人助手运行环境。

边界说明:Vellum AI 不直接提供底层大模型,也不是通用模型 API 供应商。它更像位于模型、工具、业务逻辑和生产环境之间的编排与治理层,价值取决于团队是否已经在构建需要长期迭代和上线治理的 AI 应用。

Vellum AI 的用户与市场认可

Vellum AI 的市场信号主要来自 YC 公司档案、官方融资/发布信息、开发者文档完整度以及 Workflows SDK 的公开开源路径。YC 页面显示 Vellum 属于 Winter 2023 批次、状态为 Active、地点为 New York,并列出 Akash Sharma、Sidd Seethepalli、Noa Flaherty 为创始人。该页面还收录了 “Vellum for Agents”“Vellum Workflows”“Build production-worthy LLM applications” 等发布脉络,说明其产品形态经历了从生产级 LLM 应用平台到 Agent builder 与个人智能的演进。

融资与公司信号:YC 页面聚合的新闻信息显示,Vellum 在 2025-07-10 相关报道中出现 20M Series A 与官方公告条目;这一数字用于说明公司阶段,不应替代实时财务或商业合同判断。

开发者认可:Vellum Workflows SDK 官方博客在 2025-07-14 宣布 GA,并明确其开源、可免费试用、支持 UI 与代码双向同步。相比只提供 Web UI 的工具,SDK 路线能吸引需要版本控制、代码审查和工程交付流程的团队。

采用边界:公开页面未披露可核验的总用户数、企业客户数或平台收入。对需要量化供应商稳定性的组织,仍需在采购阶段复核 SOC/安全材料、SLA、客户案例、数据保留策略和合同条款。

Vellum AI 的成本优势:把原型、评测和上线治理放进同一条链路

Vellum AI 的成本优势不是单纯便宜,而是减少 LLM 应用从 Prompt 试验到上线后的断层。若团队用脚本、Notebook、Prompt 文档、内部后台和监控系统分别拼接,显性订阅费可能较低,但回归测试、版本追踪、线上问题定位和跨角色协作会形成隐藏成本。Vellum 的公开能力把这些环节放进一个工作台和 API 生命周期里,适合需要持续上线和迭代的 AI 功能。

成本层级 公开价格/模式 主要成本项
C 端 / 个人助手 官网定价页显示可免费开始;Pro 示例为平台费、机器规格、存储和 credits 分离计费 机器规格、存储、LLM 推理、Web search、图像生成、第三方 API credits
开发者 / API Workflows SDK 公开为开源且免费试用;平台 API 价格细项未完整公开 Prompt/Workflow 调用、评测运行、文档索引、环境隔离、工程集成
企业 / 私有化 企业级旧平台价格未公开;个人助手可自托管路径显示无平台费和机器层级收费 合同条款、数据保留策略、SSO/RBAC、SLA、安全审查、自托管运维

C 端/个人层:当前官网定价页围绕个人助手配置展开,显示 Small 免费、Medium +$35/mo、Large +$60/mo、XL +$125/mo,以及 4 GiB 免费到 500 GiB +$120/mo 的存储阶梯;Pro 示例显示 $10/mo 平台费、Medium 与 10 GiB 存储组合,credits 另行按用量计费。

开发者/API 层:LLM 应用平台文档公开了 API key、环境隔离、Prompt/Workflow execution、Test Suites、Document Indexes 等接口,但没有在公开页面给出所有旧平台套餐的完整价格。预算评估应以官方实时页面与商务沟通为准。

企业/私有化层:企业用户的真实成本通常来自安全审查、数据留存、监控数据保留、模型供应商费用、私有网络、环境隔离和内部流程改造。Vellum 在安全文档中说明交互会用于监控、调试和质量评估,并支持企业配置数据保留策略,这些能力对合规团队有价值,但也需要逐条确认合同边界。

Vellum AI 的主要功能

Vellum AI 的功能可以按“构建、测试、部署、监控、扩展”五段理解。它不是只解决 Prompt 文案,而是把 Prompt、Workflow、模型调用、评测指标、生产执行记录和 API 集成放进一个闭环。

  • Prompt 工程与协作:文档包含 Prompt Engineering、Collaboration、Custom Models、Multimodality、Prompt Caching 等模块,适合多人维护 Prompt、比较模型输出和控制 Prompt 变更。
  • Workflow 编排:Workflows 用低代码界面定义 LLM 调用链和业务逻辑,支持 Input Variables、Scenarios、Nodes、Edges、Final Outputs;部署后可以通过 API 调用并记录输入、输出和每步延迟。
  • Agent Node 与工具调用:Agent Node 自动处理 OpenAPI schema 生成、循环逻辑和 function call 输出解析,用于减少手写工具调用流程的重复工程。
  • Evaluation & Test Suites:Test Suites 使用返回 0 到 1 分数的 Metrics 对 Prompt 或 Workflow 做量化评测,适合大规模场景、回归测试和部署前质量门禁。
  • Deployments 与环境隔离:Deployment 可对应 Prompt 或 Workflow,Environment 提供开发、测试、生产等隔离,包含独立 API keys、Release history、文档索引和监控数据。
  • Observability in Production:生产执行会被自动记录,支持查看请求、输入、输出、延迟、成本和用户反馈,用于调试、性能优化和质量改进。
  • Documents 与 Search API:文档索引和 Search API 可用于 RAG 场景,且搜索结果按 Environment 的 API key 隔离,减少开发/生产数据混用。
  • Workflows SDK:以声明式、类型安全的方式定义 Agentic AI systems as graphs,并支持代码与 Vellum visual editor 双向同步。

这些功能的验收重点不在“是否能生成一次答案”,而在能否把同一条 AI 业务链路反复测试、版本化、部署和追踪。对于生产级 LLM 应用,这是 Vellum 相比普通 Prompt 工具更值得关注的部分。

Vellum AI 的模型与版本演进

Vellum AI 没有公开一个类似“v1/v2”的单一产品版本号,版本线索更适合按产品能力里程碑理解。

平台文档与能力面

  • 2026-06-10:Platform Docs 公开更新时间。官方文档站 sitemap 显示大量产品与开发者页面在这一时间更新,覆盖 Agent Builder、Prompts、Workflows、Evaluation、Deployments、Monitoring、Documents、Security、Client SDK 与 Workflows SDK。
  • 2025-07-14:Workflows SDK GA。官方博客宣布 Workflows SDK 正式可用,定位为用于定义 agentic systems 的表达式框架,并提供 CLI 与 UI 双向同步。
  • 2023:YC W23 与早期生产级 LLM 应用定位。YC 公司页保留了 Vellum 作为 “Build production-worthy LLM applications” 的早期发布脉络。

产品方向变化

2026 年官网首页、定价页和 llms.txt 把 Vellum 描述为个人智能平台,强调个人助手具备长期记忆、工具、身份、桌面控制和云/本地运行。与此同时,独立文档站仍保留面向 LLM 应用开发者的完整平台文档。这意味着 Vellum 的最新公开产品重心已经从纯 B2B LLM 开发平台扩展到 Personal AI,但开发平台能力并未从文档中消失。

对采用方而言,版本演进的实际含义是:若目标是企业 LLM 应用平台,应重点确认旧平台能力、Workflows SDK、Evaluation、Deployment 和 Monitoring 的当前商业可用性;若目标是个人助手,应重点确认桌面端、云端、credits、自托管和数据控制路径。

Vellum AI 的技术优势

Vellum AI 的技术优势集中在“工程闭环”和“可治理的 Agent/Workflow 图”。

图式编排机制:Workflows 把 Prompt Node、API Node、Code Execution Node、Guardrail Node、Conditional Node、Merge Node、Final Output Node 等能力组织成图。机制上,团队能把 LLM 调用、工具请求、检索、业务规则和结果输出拆成可观察节点;效果上,线上问题不再只是“模型回答错了”,而能定位到检索、Prompt、工具调用或后处理中的具体环节;适用场景是 RAG、客服、销售运营、文档抽取、多 Agent 协作等多步任务。

评测与运行时护栏:Evaluation Metrics 可在 Test Suites 中用于回归测试,也可通过 Guardrail Node 进入 Workflow 执行路径。机制上,评分不只发生在离线报告里,还能影响后续分支;效果上,团队可以在生成结果不满足阈值时重试、转人工或走备用路径;适用场景是知识问答、合规文本生成和需要质量门槛的自动化流程。

环境与版本隔离:Deployment lifecycle 文档明确 Environment 维护独立 API keys、Release histories、document indexes 和 monitoring data。机制上,开发、测试和生产不共享关键执行上下文;效果上,团队能降低 Prompt/Workflow 改动直接污染生产链路的风险;适用场景是多人协作、受监管业务和持续交付流程。

代码与可视化协作:Workflows SDK 支持 graph 结构静态、声明式、类型安全,并与可视化编辑器双向同步。机制上,开发者可用代码审查和版本控制维护核心逻辑,业务侧可在 UI 中理解和反馈流程;效果上,减少“低代码平台难进工程流程”和“纯代码流程业务方看不懂”的两端割裂。

如何使用 Vellum AI

Vellum AI 的使用入口取决于目标形态:LLM 应用开发平台、Workflows SDK,或个人 AI 助手。

入口 适合对象 使用要点
Vellum Web / App 控制台 产品、AI 工程、业务运营团队 注册账户,建立 Prompt/Workflow Sandbox,配置模型、变量、场景和部署环境
Client SDK / API 后端、平台、数据团队 使用 Environment-scoped API keys 调用 Prompt/Workflow、Document Index、Test Suites 等接口
Workflows SDK 需要代码优先的 AI 工程团队 用 Python SDK 定义类型安全图结构,再通过 CLI 与 Vellum UI 双向同步
Mac / 自托管个人助手 个人与本地优先用户 当前官网提供 Mac 下载、自托管和本地 workspace 路径;需自行确认 API key、数据与运行环境

典型落地路径可以分三步。第一步先在 Sandbox 中定义一个低风险任务,例如客服摘要、销售线索分析或文档抽取,并准备 10 个以上场景作为最小评测集。第二步把 Prompt 或 Workflow 部署到 Development / Staging 环境,通过 API 接入业务系统,记录执行输入、输出、延迟和成本。第三步再引入 Test Suites、Release Tags、生产监控和数据保留策略,形成可回滚、可审计、可持续迭代的上线链路。

如果团队只需要一次性 Prompt 调试,Vellum 的平台能力可能显得偏重;如果团队已经需要把 AI 功能嵌入生产业务,并且担心模型切换、Prompt 回归、工具调用失败和线上可观测性,Vellum 的价值会更明显。

Vellum AI 的产品定价

当前官网公开定价页主要围绕个人助手和云端运行资源展开,而旧 LLM 应用平台的企业级完整价格未在公开页面稳定披露。因此,价格判断应分开看。

定价项 公开信息 备注
免费开始 官网显示 Start free、No credit card to start 适合个人助手或早期试用,具体额度以实时页面为准
Pro 示例 页面显示 $10/mo 平台费,机器与存储另计 机器规格、存储和 credits 分离
Credits $1 = 1 credit 用于 LLM inference、web search、image generation 和经 managed OAuth 路由的付费第三方 API
机器规格 Small 免费;Medium +$35/mo;Large +$60/mo;XL +$125/mo 官网定价页面向 assistant compute ceiling
存储 4 GiB 免费;10 GiB +$5/mo 至 500 GiB +$120/mo persistent disk,包括文件、笔记、对话历史、skills 与 workspace 数据
自托管 页面说明无平台费、无机器 tier charges 仍有自有硬件、VPS、私有云和运维成本
企业 LLM 平台 未公开完整固定价目 需商务确认 seats、SLA、安全、数据保留、私有部署和支持条款

成本不确定项:Vellum 当前官网的公开价格更偏个人助手运行资源,并不等同于所有 LLM 应用平台能力的企业价。对团队采购,应把平台订阅、模型供应商 token、检索/搜索、评测运行、监控数据留存、私有网络和安全审计一起纳入总成本。

Vellum AI 的应用场景

  • 生产级 Prompt 管理:适用于同一个 Prompt 需要多人协作、模型对比、场景评测和部署版本追踪的团队。验收重点是每次 Prompt 改动是否能触发回归测试,并保留上线后的执行记录。
  • 多步骤 Agent / Workflow 编排:适用于需要串联 LLM、检索、API、代码执行、条件分支和人工升级的流程。验收重点是每个节点的延迟、失败处理、输入输出和成本是否可观察。
  • RAG 与文档问答:Documents、Search API 和 Environment-scoped document indexes 适合把文档检索嵌入 Prompt/Workflow。验收重点是检索命中率、引用上下文质量、不同环境数据隔离和幻觉控制。
  • 评测驱动开发:Evaluation & Test Suites 适合在上线前批量评估 Prompt/Workflow,避免模型切换或参数调整带来隐性回归。验收重点是指标是否贴近业务目标,而不是只追求通用分数。
  • 个人 AI 助手与自托管:当前官网展示个人助手、长期记忆、工具、独立身份和本地/云端运行。验收重点是数据所有权、API key 管理、本地 workspace 可读性和实际工具权限控制。

这些场景的共同点是“AI 输出会进入真实业务流程”。如果 AI 仅用于零散探索,轻量聊天工具或单独 Prompt 编辑器可能更省;一旦进入部署、监控、回归和审计,Vellum 的平台化能力才更容易体现。

Vellum AI 的适用人群

  • AI 产品与平台团队:需要把 LLM 功能从 Demo 推进到生产系统,关注 Prompt/Workflow 版本、环境隔离、监控与回归测试。
  • AI 工程师与后端开发者:需要 SDK、API、代码优先工作流和可视化调试并存,适合使用 Workflows SDK 与 Client SDK。
  • 业务运营与 Ops 团队:需要把销售、客服、内容、产品运营中的重复判断和信息整理做成可观察 Agent 流程。
  • 合规与安全敏感团队:需要确认数据存储、保留策略、环境隔离、API key 和自托管路径,Vellum 提供相关公开文档,但合同级条款仍需复核。
  • 个人效率用户:若目标是个人 AI 助手、桌面工具调用、长期记忆和本地 workspace,当前官网产品线已经更贴近这一人群。

不太适合的情况也很清楚:团队只做一次性 Prompt 试验、没有上线监控需求、不能接受第三方平台记录执行数据,或短期内无法投入评测集和流程治理。Vellum 的价值来自工程闭环,缺少这些前提时,学习和迁移成本可能高于收益。

Vellum AI 的总结与展望

Vellum AI 是一个正在经历产品叙事转换的工具:它的开发者文档仍然展示完整的 LLM 应用平台能力,包括 Prompt、Workflow、Evaluation、Deployment、Monitoring 与 SDK;官网主页和定价页则把个人 AI 助手、长期记忆、自托管和云端资源计费放在更突出位置。这个变化不一定削弱其开发平台价值,但会让选型者更需要确认当前采购入口和商业条款。

当前限制主要有四类。第一,旧 LLM 平台的企业价格、客户规模和完整 SLA 未在公开页面充分披露。第二,官网面向个人助手的价格结构不能直接推导为企业 LLM 平台价格。第三,生产级使用需要团队自行建设评测集、失败处理和权限治理,平台不能自动替代业务验收。第四,数据存储与交互记录会用于监控和调试,合规团队需要结合数据保留策略逐项确认。

落地建议是先用一个低风险但真实的 AI 工作流试点:准备 10 到 30 个代表性场景,在 Vellum 中搭建 Prompt/Workflow,使用 Test Suites 做回归测试,再通过 Staging 环境接入内部系统。扩展前重点确认四件事:模型与第三方 API 成本是否可控,生产监控是否满足排障要求,数据保留和环境隔离是否符合合规要求,企业合同是否覆盖 SSO、SLA、支持和自托管边界。

版本信息

  • Vellum Platform Docs 2026-06-10 :官方文档站公开索引的更新时间;当前文档覆盖 Agent Builder、Prompts、Workflows、Evaluation & Test Suites、Deployments、Monitoring、Documents、Security、Developers 与 Self-Hosting 等产品模块。
  • Workflows SDK GA :Vellum 官方博客宣布 Workflows SDK 正式可用,用于以声明式、类型安全方式定义 Agentic AI systems,并支持代码与可视化编辑器双向同步。
  • YC W23 Company Profile :Y Combinator 公司页显示 Vellum 属于 Winter 2023 批次,公开描述中包含面向 Agent、Workflow 与生产级 LLM 应用的产品发布脉络;精确日以 YC 页面实时信息为准。

用户评价

  • 加载评价中...