Lunary
免费
Lunary 是面向 LLM 应用团队的 AI开发工具 与 LLMOps 平台,围绕可观测性、日志、链路追踪、Prompt 模板、Prompt Playground、数据集、评测、反馈和安全合规,帮助团队把 AI 应用从“能调用模型”推进到“可监控、可迭代、可治理”。
Lunary 工具正文
Lunary 的核心参数与统计
| 参数 | 当前公开信息 | 核验说明 |
|---|---|---|
| 产品定位 | Observability and prompt management platform for LLM-based apps | 官网标题与描述直接确认 |
| 核心能力 | Analytics、Logs、Tracing、Prompt Templates、Prompt Playground、Evals、Datasets、Feedback | 官方 docs 的功能页与 API 索引确认 |
| 接入方式 | Python SDK、JavaScript SDK、OpenTelemetry、OpenAI、Anthropic、Azure OpenAI、LangChain、LiteLLM、Ollama 等 | 官方 docs 集成目录确认 |
| 部署方式 | Lunary Cloud + Enterprise Edition 自托管 | 官方安全文档与 Docker / Kubernetes 文档确认 |
| 安全合规 | SOC 2 Type 2、ISO 27001:2022、GDPR / CCPA 指南 | 官方 Data Security 文档确认 |
| 官网客户标识 | IBM、Zurich、Netomi、Close、DHL 等品牌 logo | 官网首页公开展示,具体合同规模未披露 |
| 产品边界 | 监控、调试、评测和治理 LLM 应用,不是模型训练平台 | 由官方功能结构和文档范围归纳 |
Lunary 的核心价值不是“再包一层模型 API”,而是把 LLM 应用上线后最难持续管理的几类问题放到同一个工作台:谁在调用、花了多少钱、延迟和错误在哪里、Prompt 哪个版本生效、实验输出能否复现、用户反馈如何回流到评测与迭代。
核验口径上,本文以 lunary.ai 官网、docs.lunary.ai 官方文档、官方 llms.txt 文档索引和公开安全/自托管文档为依据;对未公开的客户数量、收入、留存、创始人和融资数据不做推断。
Lunary 的用户与市场认可
Lunary 面向的不是纯个人玩具型 AI 工具,而是已经把 LLM 调用嵌入产品、客服、内部应用或 Agent 工作流的团队。官网将其表达为面向 LLM-based apps 的可观测与 Prompt 管理平台,并在首页展示企业客户标识与 SOC 2、ISO 27001 认证标识,说明它的商业叙事重点放在生产可用性、团队协作和安全信任上。
从开发者侧看,Lunary 的认可主要体现在接入路径完整:既支持常见模型供应商的 SDK 包装,也支持 OpenTelemetry 标准入口。对已经使用 LangChain、LiteLLM、Ollama 或自定义模型网关的团队来说,这比“只支持某一个模型厂商”的监控工具更容易进入现有架构。
需要谨慎的是,官网没有公开可核验的总客户数、月调用量、ARR 或行业渗透率。因此,采购评估时应把可访问的产品能力、安全文档、自托管要求和试点数据作为主依据,而不是把客户 logo 直接等同于规模化成功。
Lunary 的成本优势
Lunary 的成本优势主要来自“减少不可见损耗”,而不是单纯降低模型 token 单价。LLM 应用进入生产后,真正昂贵的部分往往是无法定位的异常、重复实验、Prompt 版本混乱、没有用户反馈闭环,以及模型切换时缺少可比较数据。
| 成本层级 | Lunary 的公开能力 | 价值判断 |
|---|---|---|
| 个人 / 早期项目 | 官网 Pricing 页面提供免费起点 | 适合低成本验证日志、Prompt 管理和基础监控流程 |
| 开发团队 | Web 控制台 + SDK + API + OpenTelemetry | 把质量、成本、延迟和错误定位前移到开发与上线流程中 |
| 企业部署 | Scale / Enterprise、审计报告、自托管、Docker / Kubernetes 文档 | 适合有数据边界、合规审计和私有部署要求的组织 |
| 隐性成本 | 模型调用费、评测样本维护、数据留存策略、权限治理 | Lunary 降低排查与治理成本,但不会消除模型和工程成本 |
对团队来说,Lunary 的 ROI 应该按“减少一次线上事故的排查时间”“降低 Prompt 回归风险”“减少无效模型调用”“让非工程成员安全参与 Prompt 迭代”来衡量。若项目仍停留在 demo 阶段、调用量很低且没有协作需求,完整 LLMOps 平台的收益会被低估。
Lunary 的主要功能
- Analytics:自动统计 LLM 调用成本、调用量、token 使用、平均延迟、错误数和用户使用趋势,帮助团队从“感觉很贵”转为按模型、用户和时间维度归因。
- Logs:记录和检查 LLM 请求与响应,适合复盘异常回答、排查空输出、定位模型供应商错误和分析真实用户输入分布。
- Tracing:针对复杂 Agent、Chain 和 Tool 调用提供链路追踪,官方 SDK 支持包装 agent、chain、tool,让一次用户请求里的多步操作可被串联查看。
- Prompt Templates:将 Prompt 从代码中抽离出来做存储、版本管理、协作和 A/B 测试,减少改 Prompt 就必须重新部署代码的摩擦。
- Prompt Playground:提供交互式 Prompt 测试环境,可比较不同模型、参数与变量,也能连接自定义 API endpoint 来测试 RAG 或 Agent 系统。
- Datasets 与 Evals:官方 API 索引包含 dataset v2、evaluation、criterion、result 等接口,适合把测试样本和评测流程沉淀为可重复资产。
- Feedback Tracking:支持记录用户对回答的点赞、点踩、评论或自定义 JSON 反馈,并可用于过滤调用与后续微调数据准备。
- OpenTelemetry 接入:通过
/v1/otel接收 OTEL traces,便于接入多语言、多框架和已有可观测体系。 - 安全与治理:提供数据安全说明、GDPR/CCPA 指南、自托管边界、安全联系邮箱和 SOC 2 / ISO 27001 说明。
这些能力组合起来,Lunary 更像“AI 应用生产控制台”,而不是单独的日志查看器。它把 Prompt、调用、用户反馈和评测数据放在同一个上下文里,降低了跨工具拼接证据的成本。
Lunary 的模型与版本演进
Lunary 的版本演进不能只按传统客户端版本号理解。公开页面呈现的是一套云端平台能力持续扩展:从基础日志和可观测,延伸到 Prompt 模板、Playground、数据集、评测、反馈、OpenTelemetry 和自托管。
当前可核验的公开节点包括:
- 官网当前公开版本:官网直接定义 Lunary 为 LLM 应用的可观测与 Prompt 管理平台,并展示安全认证、客户标识与主要入口。
- 官方文档功能体系:docs 索引中已经包含 Observability、Prompt Templates、Prompt Playground、Feedback、Product Analytics、API、OpenTelemetry、自托管、安全合规等页面。
- Enterprise 自托管示例:Docker 文档展示
lunary/backend:1.4.8与lunary/frontend:1.4.8镜像组合,说明企业版自托管有独立部署路径。
因此,评估 Lunary 时更应关注“能力面是否覆盖你的生产流程”,而不是寻找一个单独的“最新模型版本”。它本身不训练或发布基础大模型,而是围绕多模型应用的运行、调试和评测做治理层。
Lunary 的技术优势
SDK 自动采集:官方 Observability 文档明确说明,集成 SDK 后 analytics 和 logs 会自动捕获。这降低了早期接入成本,团队可以先拿到成本、延迟、错误和调用量,再逐步补充更细的 tracing 与反馈。
链路级追踪:对 Agent 和工具调用而言,单条 LLM 请求日志常常不够。Lunary 的 agent、chain、tool 包装能力能把子步骤归到同一次链路里,适合排查“工具调用错了”“检索结果不对”“模型回答受上一步影响”等多步问题。
Prompt 与代码解耦:Prompt Templates 让开发者通过 SDK 渲染模板,同时仍能保留调用追踪。这样非工程成员可以参与 Prompt 版本迭代,工程团队则保留部署、权限和回滚边界。
OpenTelemetry 兼容:OTEL 是通用可观测标准。Lunary 支持接收 OTEL traces,意味着团队可以把 LLM 应用纳入更大的分布式追踪体系,而不是完全依赖专有 SDK。
合规与自托管路径:官方安全文档写明 Cloud 与 self-hosting 的责任边界,并说明自托管适合需要完全控制数据的场景。对医疗、金融、政府或高敏数据项目,这一点比单纯的 UI 功能更关键。
如何使用 Lunary
| 入口 | 适合对象 | 使用方式 |
|---|---|---|
| Lunary Cloud Web | 产品、工程、运营团队 | 注册后创建项目,在控制台查看日志、Prompt、评测和分析 |
| Python SDK | Python 后端、数据应用、Agent 项目 | 安装 SDK,包装 OpenAI / Anthropic / Azure OpenAI 或手动记录 run |
| JavaScript SDK | Node.js、Next.js、前端反馈采集 | 接入 JS SDK,监控模型调用并上报用户反馈 |
| OpenTelemetry | 已有可观测体系的工程团队 | 将 OTEL traces 发送到 https://api.lunary.ai/v1/otel |
| API | 平台工程与内部工具 | 通过 Runs、Templates、Datasets、Evals、Views 等 API 做自动化 |
| Self-hosted | 企业与强合规团队 | 使用 Enterprise Edition 的 Docker / Kubernetes 文档部署 |
推荐落地路径是:先接入最小 SDK 采集调用日志和成本,再把关键 Prompt 迁移到 Templates;随后建立小型评测数据集,对核心场景做回归;最后把反馈、权限、自托管或 OTEL 接入纳入生产治理。这样能避免一开始就追求“大而全”,但又保留向生产体系扩展的路线。
Lunary 的产品定价
Lunary 官网提供公开 Pricing 页面,面向不同规模团队提供免费起点、付费团队档位和企业方案。由于 SaaS 价格、事件额度、席位和功能边界会动态调整,正式采购应以官网实时 Pricing 页面和合同为准。
| 档位 | 公开状态 | 适用判断 |
|---|---|---|
| Free / 免费起点 | 官网公开提供 | 适合验证 SDK 接入、基础日志和 Prompt 工作流 |
| Pro / Team / Scale 等付费档 | 官网 Pricing 页面公开展示 | 适合增长中的产品团队,重点核验事件额度、成员数量、数据保留和协作功能 |
| Enterprise | 官网提供销售沟通与企业能力入口 | 适合 SSO、审计、自托管、合规报告、专属支持和更高安全要求 |
| Self-hosted | 官方文档说明仅 Enterprise Edition 可用 | 适合必须把数据留在自有基础设施的团队 |
成本评估时不要只看月费。更重要的是确认三件事:你的月度 LLM 事件量是否会超额;日志与评测数据需要保留多久;企业合规是否需要自托管、审计报告或专属支持。对于高频 AI 产品,这些边界会比基础订阅价更影响总成本。
Lunary 的应用场景
- AI 客服与聊天机器人监控:记录用户消息、模型回答、错误和反馈,帮助团队定位幻觉、拒答、长延迟和高成本问题。
- RAG 系统调试:在 Prompt Playground 或自定义 endpoint 中测试检索增强流程,并通过 logs / traces 观察上下文是否正确进入模型。
- Agent 工作流排障:用 agent、chain、tool tracing 观察多步推理、工具调用和子任务执行结果,适合自动化助手、内部运营 Agent 和复杂工作流。
- Prompt 版本治理:将 Prompt 抽离为模板,支持协作、版本记录、测试和 A/B 实验,减少线上 Prompt 漂移。
- 模型与参数评测:用 datasets、criteria 和 evaluations 对模型、Prompt、温度、最大 token 等组合做可重复比较。
- 成本与体验监控:按模型、用户和项目观察调用量、成本、延迟和错误,为模型路由、缓存或限流提供依据。
- 合规敏感场景:在需要控制数据边界时,通过 Enterprise 自托管路线把数据留在自有环境。
Lunary 的适用人群
AI 应用开发者:已经在代码里调用 OpenAI、Anthropic、Azure OpenAI、Gemini、Mistral、Ollama 或 LangChain 等框架,需要更好地观察请求、响应、错误和成本。
产品与运营团队:需要参与 Prompt 迭代、查看用户反馈、理解功能使用情况,但不希望每次改动都依赖工程重新部署。
平台工程和 LLMOps 团队:需要为多个 AI 项目建立统一日志、指标、评测和权限治理,尤其适合希望把 OpenTelemetry 或自托管纳入架构的团队。
企业安全与合规团队:关注 SOC 2、ISO 27001、GDPR、CCPA、数据处理边界和自托管要求,需要在上线前确认供应商责任与部署方式。
不太适合的场景是:只偶尔用聊天机器人、没有真实用户调用、没有 Prompt 版本协作,也不需要评测或日志归因。此时用通用日志或模型供应商控制台就足以完成早期验证。
Lunary 的总结与展望
Lunary 适合把 LLM 应用带入生产阶段的团队。它把可观测性、日志、链路追踪、Prompt 管理、评测、反馈和安全合规整合到一套工作流里,解决的是“AI 功能上线后如何持续变好、持续可控”的问题。
它的优势在于接入面较宽、功能闭环完整,并且官方文档同时覆盖 Cloud、自托管、OpenTelemetry 和多模型集成。当前需要注意的边界是:部分商业指标未公开,Product Analytics 文档仍处于补全状态,自托管属于企业版能力,采购前必须用真实调用量、数据保留周期和安全要求做试点核验。
如果你的团队已经有稳定的 LLM 调用和明确的质量指标,Lunary 可以作为 LLMOps 控制台来建立监控、Prompt 版本、评测和反馈闭环;如果还处在 demo 阶段,建议先用免费或低门槛方案接入一条核心链路,确认它能否减少排障时间和 Prompt 迭代风险,再扩大到更多项目。
版本信息
- Lunary Enterprise Edition Docker self-hosting :官方自托管 Docker 文档示例使用 lunary/backend:1.4.8 与 lunary/frontend:1.4.8,说明企业版支持后端、前端与 PostgreSQL 组合部署。
- Lunary Cloud 当前公开版本 :以官网与官方文档当前公开状态为准,覆盖 Observability、Prompt Templates、Prompt Playground、Evals、Datasets、Feedback、OpenTelemetry、API 与自托管文档。
用户评价