新闻动态

2026年06月07日

DeepSeek V4 做数学证明：普林斯顿团队以 294 美元完成 17 万美元任务，成本优势 500 倍

普林斯顿团队用 DeepSeek V4 Flash 构建 Goedel-Architect，以 294 美元完成 PutnamBench（此前需 17 万美元），通过率 75.6% 反超 Hilbert。MiniF2F 首次刷完全部 244 题。

来源：36氪（转自机器之心）

2026年06月09日

成本护城河还是公地？DeepSeek 们把成本砍掉 99%，美国巨头的万亿豪赌何去何从

当 DeepSeek 等开放权重模型将 AI 成本砍掉 99%，美国资本基于垄断假设的万亿豪赌面临根本性挑战——AI 能力正在被商品化。

来源：36氪（神译局）

Anthropic 发布 Claude Fable 5 与 Mythos 5——迄今最强模型，带安全护栏的 Mythos 级别

Anthropic 推出 Mythos 级别模型 Fable 5（通用版带安全护栏）和 Mythos 5（网络防御版）。Stripe 一天完成两月工作量，药物设计提速 10 倍，定价 $10/$50 每百万 token。

来源：Anthropic 官方公告

2026年06月08日

中国大模型周调用量连续六周超越美国，前四名均为国产模型

OpenRouter数据显示中国大模型周调用量14.19万亿Token连续六周超越美国，DeepSeek-V4-Flash以3.69万亿蝉联全球榜首，前四名全部国产，Claude系列跌出前五。

来源：IT之家 / 每日经济新闻

2026年06月11日

AI 写高考作文对决赛：DeepSeek V4 记叙文 46 分夺冠，混元"自己人"打满分

GPT-5.5/Fable-5/DeepSeek V4/混元 3 Preview 同写 2026 年北京高考作文，DeepSeek V4 记叙文平均 46 分夺冠，混元"自己人评自己人"打出满分引热议。

来源：36氪（字母AI）

DeepSeek API 缓存计费系统故障，主动向受影响用户返还赠金

DeepSeek API缓存计费系统在5月13日至6月9日期间出现部分错误，团队主动以赠金形式向受影响用户返还相应金额，体现对开发者生态的重视。

来源：IT之家

CometAPI：一个 Key 接入 500+ 模型，均价低于原厂 20-40%

CometAPI 提供一个兼容 OpenAI SDK 的统一 API 网关，接入 500+ 主流模型，全线定价低于原厂 20-40%，按量计费无月费。

来源：CometAPI 官方

Mem0 累计服务 9 万开发者，发布 LoCoMo/LongMemEval 基准测评成绩

AI Agent 长期记忆平台 Mem0 披露 90,000+ 开发者规模，并公开 LoCoMo、LongMemEval、BEAM 三项基准测评成绩，强化技术可信度。

来源：Mem0 官方

Julep 品牌迁移至 memory.store，转向 Agent 长期记忆与工作流融合方向

Julep 官网域名现已跳转至 memory.store，标志着其产品方向向 Agent 记忆与工作流深度整合演进。

来源：Julep 官方

You.com 强化多接口 Web Search 能力，Agent 联网标准层继续扩展

You.com 通过 Search、Contents、Research、Finance Research API 组合，提升企业 Agent 联网能力。

来源：You.com 官网与 Pricing

Snyk 宣布收购 Invariant Labs，将 Agent 安全能力整合进开发者安全平台

Snyk 宣布收购 Invariant Labs，后者是专注 AI Agent 安全的工具厂商，产品线包括 Guardrails、Explorer 和 MCP Scan。

来源：Invariant Labs 官方

Sora 推动内容生产并行化，创意评审链路被前移

Sora 影响内容团队的核心，不是单纯提升视频生成速度，而是把创意筛选前移到并行生成阶段。

来源：OpenAI 官方发布、Sora 产品页面、创意工具平台观察、内容生产行业分析

SerpApi 强化 AI 搜索接口矩阵，搜索数据基础设施进入“Agent 就绪”阶段

SerpApi 在原有 SERP 结构化能力基础上持续扩展 AI 搜索相关接口，进一步巩固其作为 Agent 联网检索底层能力层的定位。

来源：SerpApi 官网、Pricing 页面、API 列表页

n8n 强化 AI 编排能力，工作流测试与治理要求同步抬升

n8n 正在从自动化连接器转向 AI 编排层，企业在获得更强流程能力的同时，也需要同步提升测试、监控与回滚机制。

来源：n8n 官方产品页面、官方文档、GitHub 讨论、行业媒体报道

Perplexity 推出 Comet：AI 浏览器开始把搜索推向任务执行层

Perplexity 推出的 Comet 不只是搜索入口，而是试图把信息检索延伸为任务执行，重新定义 AI 浏览器的评价标准。

来源：Perplexity 官方产品页面、官方演示、Hacker News、Product Hunt 等第三方媒体

E2B 完成 2100 万美元 A 轮融资：AI 沙箱执行量突破 10 亿次，Fortune 100 客户覆盖 94%

E2B 宣布完成 2100 万美元 A 轮融资，同期披露累计启动沙箱 10 亿次、Fortune 100 客户覆盖率 94%、月均 SDK 下载 350 万次等核心规模数据。

来源：E2B 官方

Dappier 完善 AI Answers 价格梯度，媒体 AI 商业化路径更清晰

Dappier 公开 Free 到 Enterprise 的方案分层，强化媒体 AI 问答与变现一体化定位。

来源：Dappier 官网与 Pricing

2026年05月22日

DeepSeek V4-Pro API 永久降价至原价1/4，缓存命中仅0.025元/百万Token

DeepSeek V4-Pro API永久降价至原价1/4，缓存命中仅0.025元/百万Token，将2.5折优惠活动永久化，定价策略极具攻击性。

来源：IT之家

2026年06月18日

DeepSeek 识图模式正式上线：多模态能力产品化迈出关键一步

DeepSeek 识图模式在网页和App端正式上线，采用 Thinking with Visual Primitives 框架，与"快速模式""专家模式"并列，标志着多模态能力从研发进入产品化阶段。

来源：IT之家

GPT-5.5 Instant 健康智能突破：2.3亿周活用户，医生评价超人类

GPT-5.5 Instant 在健康评估中达到前沿模型水平，医生评价其回答超过人类医生，事实性问题率两个月下降 71%，向所有免费用户开放。

来源：OpenAI 官方 Blog