Kolena
Kolena 是一款面向企业文档密集流程的 AI数据处理 平台,通过 AI Agents 读取 PDF、Office、邮件、图片、音频等多格式输入,完成抽取、校验、模板化输出、系统集成与可审计的数据处理自动化。
核心参数与统计
Kolena 的当前产品重心是把文档密集型业务流程拆成可运行、可验证、可集成的 AI Agents。它不是只做 OCR 或单次问答的工具,而是围绕输入文件、Prompt、结构化结果、模板输出、权限与审计形成一套企业级流程平台。对地产、金融服务、保险、银行这类高度依赖合同、表格、邮件和审查材料的团队,Kolena 的价值在于把非结构化材料变成可复核的数据与报告。
| 参数 | 当前能力 |
|---|---|
| 产品定位 | 企业文档工作流 AI 自动化平台 |
| 核心对象 | Agent、Prompt、Run、Ground Truth、Validation、Workspace |
| 典型输入 | PDF、扫描件、Office 文档、电子邮件、表格、图片、文本、音频、压缩包 |
| 单次运行限制 | 最多 300 个文件、2 GB 总文件、单文件 250 MB、1,500 页内容 |
| Prompt 附件限制 | 每个 Prompt 最多 5 个文件,每个文件 5 MB |
| Prompt 创建文件限制 | 单文件最高 20 MB |
| 输出方式 | Web 结果、API JSON、Webhook、Word/Excel/CSV 模板、PDF 下载 |
| 集成入口 | Amazon S3、Azure Blob Storage、Box、Email、Gmail、Google Drive、SharePoint、CRM、Webhook、API |
| 企业治理 | 用户管理、团队、工作区、角色、Agent 级权限、审计日志、数据保留、IP 白名单、SSO/SCIM |
| 安全基础 | 数据不用于训练 AI 模型,美国云数据中心存储,传输与静态加密 |
这些参数说明 Kolena 更适合“材料进入、AI 处理、结果出表、系统回写”的连续流程,而不是一次性的文档摘要工具。尤其是 300 个文件、2 GB、1,500 页的单次运行边界,使它可以承接批量尽调、合同审查、保险材料分析等重负载任务;模板输出和集成能力则把结果接回团队已有的 Word、Excel、CRM、网盘或数据仓库。
用户与市场认可
Kolena 的市场识别度主要来自两个方向:一是企业文档流程自动化,二是早期机器学习测试平台积累的工程可信度。主站将行业聚焦在 Real Estate、Financial Services、Insurance、Banking,并展示 Gateway、Union Pacific、SFA Partners、Prostar 等客户标识,说明产品更偏 B 端采购与行业化解决方案,而不是通用个人生产力应用。
从开发者生态看,Kolena 仍维护 kolena Python 包,包描述将其定义为机器学习测试平台客户端,并以 Apache-2.0 许可发布。这个历史脉络对当前 AI Agent 产品也有意义:企业在使用文档 Agent 时,往往不只关心能否生成答案,还关心能否测量准确率、保存 Ground Truth、比较 Validation 结果、追踪访问与数据处理过程。Kolena 把这些评估和治理要素延伸到文档自动化场景,形成了区别于普通文档解析工具的门槛。
成本优势
Kolena 的成本优势不在公开标价低廉,而在于把大批量人工审阅、资料录入、模板填报和跨系统同步转化为可复用 Agent。对于地产租约抽象、保险 loss run 分析、银行合规测试等工作,真正昂贵的通常是人工复核时间、返工率、交付周期和审计留痕成本。
| 方案 | Starter | Professional | Enterprise |
|---|---|---|---|
| 月度信用额度 | 800 | 1,800 | 定制报价 |
| 用户席位 | 3 | 10 | 15 起,可定制 |
| API 与 Python SDK | 支持 | 支持 | 支持 |
| 集成与模板输出 | 支持 | 支持 | 支持 |
| Dashboard | 不含 | 支持 | 支持 |
| 数据分析与 Web Search | 不含 | 支持 | 支持 |
| 审计日志、Agent 权限、自定义角色 | 不含 | 不含 | 支持 |
| 数据保留、服务用户、SSO/SCIM、团队与工作区 | 不含 | 不含 | 支持 |
如果只是少量文档的临时抽取,Kolena 的平台化能力可能显得偏重;但当团队需要稳定处理大量文件、复用模板、控制访问、导出审计日志并接入现有系统时,按信用额度和席位采购比反复搭建脚本、人工录入和手动质检更容易形成可预测成本。
主要功能
Kolena 的主要功能围绕 Agent 生命周期展开。用户先创建 Agent,配置输入来源和 Prompt,再把运行结果输出到模板、API、Webhook 或外部系统。Prompt 是每个 Agent 的核心构件,用于定义如何读取材料、抽取字段、生成判断、形成结构化结果。
| 功能 | 适用任务 | 使用价值 |
|---|---|---|
| AI Agent 编排 | 多文件、多步骤文档处理 | 将审查、抽取、生成和校验固定为可重复流程 |
| Prompt 库与 Prompt 创建 | 租约、尽调、合规、模型填报 | 降低从空白流程开始设计的成本 |
| Ground Truth 与 Validation | 准确率评估、结果回归 | 用已知答案检查 Agent 输出质量 |
| 模板输出 | Word 报告、Excel 模型、CSV 数据表 | 保留原有格式、公式和报告结构 |
| 多源集成 | 网盘、对象存储、邮件、CRM、Webhook | 让材料和结果在现有系统中流转 |
| API 与 Python 客户端 | 程序化提交文件、读取结果 | 适合批处理、内部应用和数据管道接入 |
| 权限与审计 | 企业团队协作、合规追踪 | 控制谁能访问 Agent 与数据,并记录访问行为 |
这些功能的组合让 Kolena 更像“文档作业系统”,而不是单点 AI 插件。团队可以先在 Web UI 验证 Prompt,再用 API 批量提交文件,最后将结果写入 Word、Excel、Google Drive、SharePoint、CRM 或内部 Webhook。
模型与版本演进
Kolena 的版本演进可以分成两条线。第一条是当前的 Kolena AI Agents 云端产品线,围绕文档工作流、Prompt、集成、模板输出和企业治理持续更新;第二条是 kolena Python Client 与 Testing with Kolena 文档,服务于机器学习测试、细粒度评估和模型行为追踪。
当前云端产品没有公开语义化版本号,适合在文档中按 Cloud 形态记录。它的关键能力已经扩展到 Agent Run、Ground Truth、Validation、Usage Records、Access Logs、Workspaces、API Keys 等对象,说明产品从“能处理文档”进一步走向“能管理文档 AI 流程”。Python 客户端最新公开包版本为 1.69.0,仍保留 ML testing 平台的开发者入口;对企业来说,这体现了 Kolena 在评估、测试和可追踪性上的产品基因。
技术优势
Kolena 的技术优势来自“文档理解 + 流程编排 + 结果评估 + 企业治理”的组合。许多文档 AI 工具停留在抽取字段或生成摘要,Kolena 则把 Agent 输出和 citations、confidence、reasoning、Validation 结果等元数据一起返回,便于做复核和审计。
在工程接入层,Kolena 提供 Web UI、REST API、Python Client 和 Webhook。API 返回结构中包含 Agent ID、Run ID、文件列表、Prompt 顺序、状态、结果值和元数据,这让研发团队可以把 Kolena 嵌入内部系统,而不是只能由业务人员手动下载结果。对安全和合规团队,数据不用于模型训练、云端加密、IP 白名单、审计日志、数据保留、SSO/SCIM 等能力降低了企业采购阻力。
另一个优势是模板输出。Kolena 可以把 Agent 结果填入 Word、Excel 或 CSV 模板,并保留文档原有样式、格式、公式和宏。这对金融模型、租约摘要、尽调报告等场景很关键,因为业务团队往往不只是需要数据,还需要沿用既有交付格式。
如何使用
Kolena 的典型使用路径是先在 Web UI 中创建 Agent,再用样例文件调试 Prompt,确认输出结构和验证标准,最后接入 API、集成或模板输出。对于非研发团队,Web UI 更适合配置 Agent 和检查结果;对于平台团队,API、Python Client 和 Webhook 更适合规模化运行。
| 入口 | 适合角色 | 典型动作 |
|---|---|---|
| Web UI | 业务运营、分析师、合规团队 | 创建 Agent、配置 Prompt、上传样例文件、查看 Run 结果 |
| API | 工程团队、数据平台团队 | 上传文件到 Agent Run、查询结果、下载模板化输出 |
| Python Client | 数据科学与自动化团队 | 批量调用、读取日志、接入内部处理脚本 |
| 集成 | IT 与业务系统负责人 | 连接 S3、Azure Blob、Google Drive、SharePoint、Email、CRM、Webhook |
| 模板输出 | 交付与报告团队 | 生成 Word、Excel、CSV 或 PDF 交付物 |
推荐的落地节奏是先选择一个高频、边界清晰、人工成本高的流程,例如租约抽象、loss run 分析或贷款资料审查;用 20 到 50 份代表性材料建立 Prompt 和 Ground Truth;通过 Validation 比较输出准确率;最后再接入对象存储、邮件或 CRM,把流程从试点迁移到稳定运行。
产品定价
Kolena 采用组织层级和信用额度相结合的方式。Starter 与 Professional 给出固定月度信用额度和席位,Enterprise 面向更复杂的权限、安全和组织治理需求。公开层级说明中,所有层级都支持 API、Python SDK、集成、模板输出和无限 Agents;真正拉开差异的是 Dashboard、数据分析、Web Search、审计日志、Agent 级权限、自定义角色、数据保留、SSO/SCIM、团队和工作区。
采购时应重点确认四类成本:第一是每月信用额度能覆盖多少 Agent Runs;第二是输入文件大小、页数和并发流程是否匹配真实业务量;第三是是否需要 Enterprise 才能满足审计、SSO、数据保留和细粒度权限;第四是模板、Webhook、CRM 或网盘集成上线后,内部流程变更和复核机制的维护成本。
应用场景
Kolena 最适合有大量非结构化材料、固定审查规则和强交付格式要求的团队。它的行业场景集中在地产、金融服务、保险与银行,但其底层能力也适合任何需要把复杂文件转成可验证结构化结果的企业流程。
- 地产与资产业务:处理租约抽象、rent roll、贷款 sizing、按揭尽调和季度租约审计,减少人工翻阅合同、修订条款和表格录入时间。
- 金融服务:生成投资分析、PE fund modelling、风险评估和会计运营材料,把多份 PDF、表格和备忘录整理成可复核模型输入。
- 保险:分析 loss run、保单、COI、理赔材料和承保资料,用结构化结果支持理赔处理、风险画像和承保审查。
- 银行与合规:处理贷款包、UCC filing、客户投诉、监管审查和补偿流程,利用审计日志与权限控制满足合规团队要求。
- 内部运营:把邮件、网盘文件和 CRM 对象连接到 Agent,让重复文档审核和资料同步进入自动化队列。
适用人群
Kolena 适合三类用户。第一类是行业业务团队,例如地产资产管理、保险理赔、银行合规和金融分析团队,他们需要从大量材料中快速得到可信结果。第二类是企业 IT、数据平台和自动化团队,他们负责把 Agent 接入现有网盘、对象存储、CRM、Webhook 或内部应用。第三类是 AI 治理和质检团队,他们关心 Ground Truth、Validation、访问日志、权限、数据保留和结果可追溯性。
不太适合的情况也很明确:如果团队只是偶尔处理几页文档,或者没有固定输出格式、没有复核标准、没有系统集成需求,Kolena 的企业级能力会显得过重。它更适合已经存在稳定流程、明确字段、明确责任人和规模化处理量的组织。
总结与展望
Kolena 的核心竞争力在于把文档 AI 从“单次生成答案”推进到“企业级自动化流程”。它支持复杂输入、Prompt 编排、模板输出、API 调用、集成、权限、审计和数据保留,能够服务需要准确性、可复核性和稳定交付的行业团队。与此同时,早期 ML testing 平台和 Python 客户端留下的评估能力,使它在验证 Agent 输出、构建 Ground Truth 和管理回归方面更有工程厚度。
后续观察重点包括三件事:云端 Agents 是否继续增强对行业模板和预置 Prompt 的覆盖;Enterprise 层级的审计、权限和数据保留能力是否更易配置;Python Client 与当前文档 Agent 产品线是否进一步融合。对于准备采购的团队,最佳切入点不是一次性替换整个文档流程,而是选一个高频、高价值、可测量准确率的流程,让 Kolena 在小范围内证明节省时间、降低返工和增强审计能力。
版本信息
- Kolena AI Agents :当前主站产品形态聚焦企业文档工作流 AI Agents,支持 Prompt 编排、文件上传、API 调用、Python 客户端、模板输出、集成、权限、审计、数据保留与企业层级治理。
- kolena Python Client 1.69.0 :面向 Kolena 机器学习测试平台的 Python 客户端公开包版本,支持通过代码管理测试数据、指标和模型评估工作流。
- Testing with Kolena :开发者文档展示了 Kolena 早期面向机器学习模型测试、细粒度评估、调试和回归跟踪的产品能力。
用户评价