0次浏览 发布时间:2025-04-21 07:07:00
IT之家 4 月 21 日消息,大阪都会大学医学研究生院 Hirotaka Takita 博士和 Daiju Ueda 副教授领导的研究小组近期发布一项系统性回顾和荟萃分析,深入评估了生成式人工智能(AI)在诊断医疗状况方面的表现,并将其与医生进行了对比。
研究团队筛选了总计 18371 项研究,最终确定 83 项进行详细分析。这些研究涉及多种生成式 AI 模型,包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等,覆盖了多个医疗领域。其中,GPT-4 是研究最多的模型。结果显示,这些 AI 模型的平均诊断准确率为 52.1%(95% 置信区间:47.0% - 57.1%)。部分模型的诊断准确率与非专家医生相当,两者之间没有显著统计差异(准确率差异:0.6% [95% 置信区间:-14.5% 至 15.7%],p=0.93)。然而,专家医生的表现仍优于 AI,其准确率差距为 15.8%(95% 置信区间:4.4% - 27.1%,p=0.007)。尽管如此,随着技术的不断进步,这一差距可能会逐渐缩小。
研究还发现,AI 在大多数医学专科的表现较为一致,但有两个例外:皮肤科和泌尿科。在皮肤科,AI 的表现更为出色,这可能是因为该领域涉及模式识别,而这是 AI 的强项。但皮肤科同样需要复杂的推理和针对患者的决策,因此 AI 的优势并不能完全反映其在该领域的实际应用价值。对于泌尿科,研究结果仅基于一项大型研究,因此其结论的普适性受到一定限制。
“这项研究表明,生成式 AI 的诊断能力与非专家医生相当。它可以用于医学教育,支持非专家医生,并在医疗资源有限的地区协助诊断。”Hirotaka Takita 博士表示,“未来的研究需要在更复杂的临床场景中进行评估,使用实际病历进行性能评估,提高 AI 决策的透明度,并在不同患者群体中进行验证,以进一步证实 AI 的能力。”
IT之家注意到,除了诊断领域,该研究还强调了生成式 AI 在医学教育中的潜力。研究人员指出:“当前生成式 AI 模型在非专家环境下的表现与医生相当,这为将 AI 整合到医学培训中提供了机会。” AI 可以用于模拟真实病例,帮助医学生和受训者学习和评估他们的技能。
然而,研究也对这些模型的透明度和偏见提出了担忧。许多 AI 系统并未公开其训练数据的详细信息,这引发了关于其结果是否适用于所有人群的疑问。研究人员强调,“透明度确保了对模型知识、背景和局限性的理解”,并强调需要开发清晰、符合伦理且经过充分验证的 AI 应用。
目前,尽管生成式 AI 具有巨大潜力,但在涉及详细患者信息的复杂病例中仍面临挑战。医生们是否需要担心失去工作?目前尚难定论,但在诊断领域,这种情况是有可能发生的。
大皖新闻讯早上7点刚过,安徽中医药大学第一附属医院(安徽省中医院)"名医堂"611诊室门口,患者已经排起了长队,其中不乏拖着行李箱远道而来的身影,他们只为了等一位专家——王圣应教授。为了帮助更多疑难杂症患者诊病,同时减轻老百姓的就医负担,下午近两点看完最后一个病人已成常态。为了让从外地赶来的患者在一
2025-08-19 11:10:00爱心义诊活动现场本报讯 (记者 周利芳 文/摄)8月12日,万科城社区和山西省中医院医共同开展爱心义诊活动。活动中,医护人员通过专业检测、义诊咨询及健康讲座,为辖区儿童提供个性化健康指导,提升家长对孩子生长的科学认知。现场,医护人员用专业仪器为孩子们检测骨龄、测量身高体重及脊柱健康筛查,并逐项记录数
2025-08-13 21:39:00个人存取款单笔5万元以上无需登记用途,差异化监管是民心所向 | 羊晚V评
2025-08-13 21:15:008月6日晚间,天阳科技(300872)发布公告称,公司正在筹划以支付现金的方式购买上海通联金融服务有限公司(以下简称“通联金服”)及相关公司的部分股权,最终的交易对手方、交易方案、持股比例、交易价格等核心要素尚未确定,投资方案仍需进一步论证和协商,尚存在重大不确定性。根据初步研究和测算,本次对外投资
2025-08-08 15:43:007月初,广东东莞街头出现了一批“特殊”的电动自行车:它们没有传统充电接口,取而代之的是小巧的氢燃料电池和储氢罐,这是东莞首批氢能两轮车商业化运营项目。按照规划,到2025年年底前,200辆氢能两轮车将穿梭于城市的大街小巷,为外卖骑手、快递员等高频用户提供工作出行新选择。氢能在轻型交通领域商业化落地,
2025-07-24 06:39:00