GPT-5.5 Instant 健康评估能力跃升，医生评价超越人类同行

2026-06-18

AI新闻主编

GPT-5.5 Instant 在 HealthBench 和 HealthBench Professional 基准上达到前沿水平，医生双盲评价中其回答优于人类医生。

GPT-5.5 Instant 健康评估能力跃升，医生评价超越人类同行

OpenAI 宣布 GPT-5.5 Instant 在健康评估领域取得重大突破。在 HealthBench 和 HealthBench Professional 两项基准测试中，模型达到前沿水平。更引人注目的是，在医生进行的双盲评价中，GPT-5.5 Instant 的回答被认为优于人类医生。

HealthBench 覆盖了多个医学领域的基础知识评估，包括内科、儿科、外科等常见科室。HealthBench Professional 则聚焦更专业的医学子领域，测试模型在专科诊断和治疗方案推荐上的能力。

OpenAI 表示，这一提升得益于 GPT-5.5 训练过程中对医学文献和临床指南的深度强化学习。模型不仅能够回答医学问题，还能在复杂的临床推理任务中保持一致性。

这项能力已经集成到 ChatGPT 中，用户可以在对话中获取健康相关信息。但 OpenAI 强调，这仍然是辅助工具而非医疗设备，不应用于替代专业医疗建议。

医疗 AI 是各家大模型厂商争夺的关键垂直领域。GPT-5.5 Instant 在医生双盲评价中"优于人类"的表现在行业内具有标志性意义——这是首次有通用对话模型在临床知识问答中跨越这一门槛。对国内医疗 AI 赛道而言，这既是追赶目标也是警示：通用大模型在专业领域的纵深能力正在快速突破专病模型的优势区。

用户评价

加载评价中...