新闻动态
2026年06月07日
DeepSeek V4 做数学证明:普林斯顿团队以 294 美元完成 17 万美元任务,成本优势 500 倍
普林斯顿团队用 DeepSeek V4 Flash 构建 Goedel-Architect,以 294 美元完成 PutnamBench(此前需 17 万美元),通过率 75.6% 反超 Hilbert。MiniF2F 首次刷完全部 244 题。
来源:36氪(转自机器之心)
2026年06月09日
成本护城河还是公地?DeepSeek 们把成本砍掉 99%,美国巨头的万亿豪赌何去何从
当 DeepSeek 等开放权重模型将 AI 成本砍掉 99%,美国资本基于垄断假设的万亿豪赌面临根本性挑战——AI 能力正在被商品化。
来源:36氪(神译局)
Anthropic 发布 Claude Fable 5 与 Mythos 5——迄今最强模型,带安全护栏的 Mythos 级别
Anthropic 推出 Mythos 级别模型 Fable 5(通用版带安全护栏)和 Mythos 5(网络防御版)。Stripe 一天完成两月工作量,药物设计提速 10 倍,定价 $10/$50 每百万 token。
来源:Anthropic 官方公告
2026年06月08日
中国大模型周调用量连续六周超越美国,前四名均为国产模型
OpenRouter数据显示中国大模型周调用量14.19万亿Token连续六周超越美国,DeepSeek-V4-Flash以3.69万亿蝉联全球榜首,前四名全部国产,Claude系列跌出前五。
来源:IT之家 / 每日经济新闻
2026年06月11日
AI 写高考作文对决赛:DeepSeek V4 记叙文 46 分夺冠,混元"自己人"打满分
GPT-5.5/Fable-5/DeepSeek V4/混元 3 Preview 同写 2026 年北京高考作文,DeepSeek V4 记叙文平均 46 分夺冠,混元"自己人评自己人"打出满分引热议。
来源:36氪(字母AI)
DeepSeek API 缓存计费系统故障,主动向受影响用户返还赠金
DeepSeek API缓存计费系统在5月13日至6月9日期间出现部分错误,团队主动以赠金形式向受影响用户返还相应金额,体现对开发者生态的重视。
来源:IT之家
CometAPI:一个 Key 接入 500+ 模型,均价低于原厂 20-40%
CometAPI 提供一个兼容 OpenAI SDK 的统一 API 网关,接入 500+ 主流模型,全线定价低于原厂 20-40%,按量计费无月费。
来源:CometAPI 官方
Mem0 累计服务 9 万开发者,发布 LoCoMo/LongMemEval 基准测评成绩
AI Agent 长期记忆平台 Mem0 披露 90,000+ 开发者规模,并公开 LoCoMo、LongMemEval、BEAM 三项基准测评成绩,强化技术可信度。
来源:Mem0 官方
Julep 品牌迁移至 memory.store,转向 Agent 长期记忆与工作流融合方向
Julep 官网域名现已跳转至 memory.store,标志着其产品方向向 Agent 记忆与工作流深度整合演进。
来源:Julep 官方
You.com 强化多接口 Web Search 能力,Agent 联网标准层继续扩展
You.com 通过 Search、Contents、Research、Finance Research API 组合,提升企业 Agent 联网能力。
来源:You.com 官网与 Pricing
Snyk 宣布收购 Invariant Labs,将 Agent 安全能力整合进开发者安全平台
Snyk 宣布收购 Invariant Labs,后者是专注 AI Agent 安全的工具厂商,产品线包括 Guardrails、Explorer 和 MCP Scan。
来源:Invariant Labs 官方
Sora 推动内容生产并行化,创意评审链路被前移
Sora 影响内容团队的核心,不是单纯提升视频生成速度,而是把创意筛选前移到并行生成阶段。
来源:OpenAI 官方发布、Sora 产品页面、创意工具平台观察、内容生产行业分析
SerpApi 强化 AI 搜索接口矩阵,搜索数据基础设施进入“Agent 就绪”阶段
SerpApi 在原有 SERP 结构化能力基础上持续扩展 AI 搜索相关接口,进一步巩固其作为 Agent 联网检索底层能力层的定位。
来源:SerpApi 官网、Pricing 页面、API 列表页
n8n 强化 AI 编排能力,工作流测试与治理要求同步抬升
来源:n8n 官方产品页面、官方文档、GitHub 讨论、行业媒体报道
Perplexity 推出 Comet:AI 浏览器开始把搜索推向任务执行层
Perplexity 推出的 Comet 不只是搜索入口,而是试图把信息检索延伸为任务执行,重新定义 AI 浏览器的评价标准。
来源:Perplexity 官方产品页面、官方演示、Hacker News、Product Hunt 等第三方媒体
E2B 完成 2100 万美元 A 轮融资:AI 沙箱执行量突破 10 亿次,Fortune 100 客户覆盖 94%
E2B 宣布完成 2100 万美元 A 轮融资,同期披露累计启动沙箱 10 亿次、Fortune 100 客户覆盖率 94%、月均 SDK 下载 350 万次等核心规模数据。
来源:E2B 官方
Dappier 完善 AI Answers 价格梯度,媒体 AI 商业化路径更清晰
Dappier 公开 Free 到 Enterprise 的方案分层,强化媒体 AI 问答与变现一体化定位。
来源:Dappier 官网与 Pricing
2026年05月22日
DeepSeek V4-Pro API 永久降价至原价1/4,缓存命中仅0.025元/百万Token
DeepSeek V4-Pro API永久降价至原价1/4,缓存命中仅0.025元/百万Token,将2.5折优惠活动永久化,定价策略极具攻击性。
来源:IT之家
2026年06月18日
DeepSeek 识图模式正式上线:多模态能力产品化迈出关键一步
DeepSeek 识图模式在网页和App端正式上线,采用 Thinking with Visual Primitives 框架,与"快速模式""专家模式"并列,标志着多模态能力从研发进入产品化阶段。
来源:IT之家
GPT-5.5 Instant 健康智能突破:2.3亿周活用户,医生评价超人类
GPT-5.5 Instant 在健康评估中达到前沿模型水平,医生评价其回答超过人类医生,事实性问题率两个月下降 71%,向所有免费用户开放。
来源:OpenAI 官方 Blog