新研究发现OpenAI的o1-preview AI模型在诊断棘手医疗案例方面优于医生

IT之家 12 月 25 日消息,由哈佛医学院和斯坦福大学组成的科研团队,在医学诊断领域深入评估 OpenAI 的 o1-preview 模型,发现其比人类医生更擅长诊断棘手的医疗案例。

根据研究报告,o1-preview 正确诊断了 78.3% 的测试案例,在 70 个特定案例的对比测试中,准确率更是高达 88.6%,显著优于其前身 GPT-4 的 72.9%。

使用医学推理质量评估标准量表 R-IDEA,o1-preview 在 80 个案例中取得了 78 个满分。相比之下,经验丰富的医生仅在 28 个案例中获得满分,住院医生则仅为 16 例。

在 25 位专家设计的复杂案例中,o1-preview 得分高达 86%,是使用 GPT-4 的医生(41%)和使用传统工具的医生(34%)的两倍多。

研究人员承认该测试存在局限性,部分测试案例可能包含在 o1-preview 的训练数据中,且测试主要集中于系统单独工作,并未充分考虑其与人类医生协同工作的场景;此外 o1-preview 建议的诊断测试成本高昂,在实际应用中存在局限性。

平台声明:该文观点仅代表作者本人,佐伊科技仅提供信息存储空间服务。发布者:rmltwz,转转请注明出处:https://www.rmltwz.com/keji/23677.html

(0)
rmltwz的头像rmltwz
上一篇 2024年12月25日 下午8:41
下一篇 2024年12月25日 下午8:42

相关推荐

  • 日本越来越多老人为入狱故意犯罪引热议:甚至希望付费入住

    1月21日消息,2003-2022年间,65岁以上囚犯数量增加几乎四倍,监狱变得更像养老院。其中女性占了很大一部分。日本最大的女性监狱每五人中就有一名老年囚犯,需要狱警帮助她们洗澡、进食、走路和服药。 一名狱警指出,监狱提供膳食、养老和医疗保健等基本需求,而有些老年人无法在外面获得这些服务。 此外,虽然必须在监狱的工厂里工作,但也提供了陪伴和稳定,对一些老年…

    2025年1月21日
    9900
  • 抖音推出送礼物红包,大厂再次上演红包大战?

    文 | 陈桥辉 封面来源 | 图虫创意 Tech星球独家发现,继微信内测送礼物功能之后,抖音也能实现赠送商品礼物,并支持本地生活团购和电商等两大领域的部分商品向好友赠送。 在今年春节时,抖音曾推出“团购随心送”的限时活动,但就目前的体验看,该活动已经成为抖音全新的常驻功能,并得到了进一步完善,用户可以将团购商品以类似“红包”的方式赠送给对方,好友在聊天界面接…

    2024年12月26日
    8100
  • 曝iPhone 17改用条形横置摄像头设计:梦回魅族17

    12月12日消息,微博话题iPhone17或改用条形横置摄像冲上热搜榜,引发热议。 据博主数码闲聊站爆料,从供应链物料看,iPhone 17系列摄像头模组改成了条形跑道设计,明年也有不少安卓新机改成这种设计。 在评论区,有网友表示时尚果然是一个轮回,梦回魅族17。 公开资料显示,2019年发布的三星Galaxy S10系列、2020年发布的魅族17以及当前在…

    2024年12月12日
    9900
  • 保时捷坐不住了!在华新设技术部:任命本土派高管李楠上位

    保时捷也不得不提速智能驾驶了,特别是在中国。 最新消息,保时捷官宣了新的任命: 李楠,土生土长的中国技术人才,曾领导AI方面的工作,仅加盟保时捷8个月后,成为中国技术部副总裁。 保时捷中国对其寄予厚望,明确表示相信李楠能够加速智驾等方面的产品升级,并且还给予了技术之外其他业务的职权。 保时捷在任命公告中,旗帜鲜明地指出,此举正是为了让产品和服务更贴合中国客户…

    2024年12月6日
    11300
  • “天宫画展”首次天地同步举办:空间站、北京、澳门三地联动!

    12月15日消息,据国内媒体报道,近日,第四届天宫画展在中国空间站、北京故宫博物院、澳门科学馆同步开展。 据悉,这是我国首次采用天地同步方式举办的画展。 正在太空执行任务的神舟十九号航天员乘组进行了在轨展示与介绍,一系列生动描绘爱国奉献、青春梦想、使命担当等主题的青少年绘画作品在天宫空间站精彩亮相。 与此同时,神舟十七号航天员乘组在北京故宫博物院与来自全国各…

    2024年12月15日
    8900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信