OpenAI推出GPT‑5.5 Instant：健康问答智能显著提升

核心升级概览

更强推理能力：在复杂的医学情境下，GPT‑5.5 Instant 能够更准确地识别急需就医的信号，并主动请求补充信息。
上下文感知：模型会根据用户提供的既往病史、药物使用等细节进行个性化回答，避免“一刀切”式的建议。
清晰沟通：对不确定的医学结论会明确标注，并提供进一步核实的方向，降低误导风险。

医师网络驱动的评估体系

OpenAI 与全球超过260名医师（覆盖60个国家、49种语言、26个专科）合作，构建了两套专属评估基准——HealthBench 与 HealthBench Professional。这些基准使用真实的健康对话和医师撰写的评分标准，衡量模型在以下维度的表现：

准确性：答案是否符合医学事实。
安全性：是否避免错误的治疗建议或误导性信息。
沟通完整性：是否提供必要的背景、解释不确定性并给出后续行动建议。
适时升级：在需要专业干预时是否明确提示用户就医。

评估结果显示，GPT‑5.5 Instant 在整体得分上已接近 OpenAI 最新的 Thinking 系列前沿模型，较前代 GPT‑5.3 Instant 提升约30%。

实测表现与安全提升

错误率下降：基于对生产环境数十亿条健康对话的隐私保护监测，含有至少一次事实错误的回复率在两个月内下降了71%。
医师对比：在 3,500 条人工审阅的病例中，医师给出的评分显示 GPT‑5.5 Instant 的整体表现优于同等数量的人工回复，尤其在“捕捉红旗症状”和“请求更多上下文”两项上优势明显。
本地化能力：模型在不同地区的医疗体系、药品名称和保险政策上表现更具针对性，减少了因地域差异导致的误导。

面向大众的意义

GPT‑5.5 Instant 已在 ChatGPT 免费版中向所有用户开放（受使用上限约束），意味着每周超过 2.3 亿的健康查询都有机会获得更可靠的答案。OpenAI 表示，健康智能的提升是实现通用人工智能（AGI）对人类生活产生直接、积极影响的关键一步，未来将继续深化医师反馈回路，推动模型在临床支持、健康教育和公共卫生等更广阔场景中的落地。

“让每个人都能在日常健康决策中得到更安全、更有依据的 AI 助手，是我们长期的使命。” — OpenAI 官方声明

OpenAI推出GPT‑5.5 Instant：健康问答智能显著提升

核心升级概览

医师网络驱动的评估体系

实测表现与安全提升

面向大众的意义

标签分类