王小川的百川智能发布全链路领域增强金融大模型,准确率超过GPT-4o

(图片来源:钛媒体AGI编辑林志佳拍摄)

“大模型六虎”加速内卷,百川智能公布金融垂直领域模型。

12月23日消息,钛媒体AGI获悉,王小川创立的通用 AI 公司百川智能今天发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上,通过行业首创自约束训练方案,Baichuan4-Finance实现金融能力和通用能力,极大提高金融场景整体可用性。其金融专业能力和场景应用能力大幅领先GPT-4o。

百川智能创立于2023年4月10日,由搜狗公司创始人、前CEO王小川创立,旨在打造中国版的OpenAI,构建中国最好的大模型底座,帮助大众轻松、普惠地获取世界知识和专业服务,并在医疗与行业领域应用落地。截至目前,百川智能已相继推出16款大模型,涵盖开源、闭源、学术科研、国产算力等多个维度。

今年10月31日,百川智能宣布推出包括Baichuan4-Turbo、Baichuan4-Air两款模型在内的一站式大模型商业化解决方案,即1+3产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链)。

如今,百川智能向金融领域提供全新的大模型产品。

具体来说,中国人民大学财政金融学院12月17日发布的金融评测体系FLAME以及国内主流开源金融评测基准FinancelQ上,Baichuan4-Finance均登上榜首。其中,FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先金融领域公认的综合实力最强的通用模型之一GPT-4o、国内首个开源中文金融大模型XuanYuan3-70B-Chat,超出GPT-4o近20%。

同时,百川智能打造了一套全链路领域增强方案,该方案覆盖了高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程。同时,Baichuan4-Finance还在领域自约束训练过程中引入了更高精的通用数据,与高质量金融数据一起进行混合训练,最终实现了模型通用能力不下降,金融能力稳定增长的效果。此外,百川智能在后训练环节也做了大量增强工作,如:通过合成数据、指令数据对模型进行有监督的微调;在强化学习策略中,针对数学计算等金融领域特别关注的场景进行样本增强等,进一步提升了模型性能。

商业化层面,目前,百川智能已经服务了数千家客户,包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。

用友表示,Baichuan4-Finance凭借其海量的金融专业知识储备,在财税知识问答场景中,准确率较Baichuan4-Turbo提升了20%,较GPT-4o提升了10%,表现尤为亮眼;软通动力表示,自部署Baichuan4-Finance以来,其客户满意度提升了20%。

事实上,百川智能已经转向行业模型领域。百川智能创始人、CEO王小川早前表示,AGI 正在产生巨大的突破,但目前百川没有达到世界级的水平,只是有一定成绩,对自己来讲有 60 分吧。主要今天在现实和理解中得找到自己的一条道路,百川认为自己已经打明牌了,有实践的路径。

“定义什么是 AGI,其实有很多行业讨论,大家不断在上面加码。之前我们讨论‘机器怎么才算有智能?’以前是图灵测试,对话者分辨不出来是人还是机器,这就算智能了。到了今天,机器还要会解数学题,还要有主动学习的能力。我理解 AGI 是做到“像人一样”,像一个数字员工,能够在多个职业里产生工作成果。之前和一个技术大佬交流,他质疑当下的大模型,他说大模型七位数乘法都做不好。我反问‘你会吗?你拿着科技公司的股份,你也不会七位数的乘法,你为什么要求 AGI 会?’这是个审美问题,我们以前总是把 AGI 当成一个工具,它是超级计算机,能精确地做计算,或者跑程序跑得很快。但 AGI 本身,我觉得就像人一样,如果审美没有建立好,你怎么去评价它呢。AGI 正在产生巨大的突破,它的文章已经写得像最顶尖的文科生了,还可以写诗,随着 OpenAI o1 的推出,AI 有了更好的逻辑推理能力,文理双修。但它并不是上帝,它像一个极其聪明的人,但它现在真的知道宇宙规律吗?”王小川表示,AGI 现在还在飞速发展中。往后还有新的突破,发展速度并没有变慢。大家都过高期待这两年的速度,也许三五年后,就会非常不一样。而今天我们从互联网时代走入到了 AI 时代,他感觉很幸运,没有错过每一个时代。

对于 AI 搜索,王小川表示,虽然这能走出百度射程,甚至能够颠覆百度,但它依然在字节产品的射程里。“从竞争角度,在大厂的 DAU(日活跃用户)范畴内,我们还是处于弱势地位,在很多地方也搞不过小公司,他们对于需求敏感度的把握,会把腰部公司撕的粉碎,他们有很强的竞争力。反过来,医疗领域大家都认为是垂类,小公司不一定做的动,虽然上一代已经投了 1000 亿进去,投资人很多都失去信心了,但投资还在持续加大。”

王小川强调,医疗绝不只是垂直方向,它不仅与 AGI 是等价的,还代表着生命科学的未来想象。

“我们从今天的智能时代走向生命时代,可能会越走越广阔,医疗是当下特别好的,独有的一个卡位,但我相信在三年、五年后,大家会看到它不是个垂直方向,它可能代表更广阔的未来。”王小川称。

(作者|林志佳,编辑|胡润峰)

平台声明:该文观点仅代表作者本人,佐伊科技仅提供信息存储空间服务。发布者:rmltwz,转转请注明出处:https://www.rmltwz.com/keji/22757.html

(0)
rmltwz的头像rmltwz
上一篇 2024年12月23日 上午11:57
下一篇 2024年12月23日 上午11:57

相关推荐

  • 特斯拉因胎压监测系统问题召回近70万辆汽车:更新软件可解决

    鞭牛士报道,12月20日消息,据外电报道,由于轮胎压力监测系统的警示灯存在问题,特斯拉正在召回近 70 万辆汽车。 根据美国国家公路交通安全管理局周四发来的一封信,此次召回包括某些 2024 款 Cybertruck、2017 年至 2025 款 Model 3 和 2020 年至 2025 款 Model Y 车辆。 问题在于,车辆上的轮胎压力监测系统警示…

    2024年12月22日
    1000
  • 智能人机交互新物种 BMW首创全景iDrive即将在2025 CES首发

    看点1:宝马新世代超感智能座舱即将首发,命名为BMW首创全景iDrive 看点2:首创全景iDrive“黑科技”包括行业首创视平线全景显示、3D抬头显示、超感智控方向盘和BMW首创向心中控 看点3:BMW首创全景iDrive以”驾驶者为中心”设计,将用户体验放在首位,满足用户的多场景交互需求 看点4:携手中国顶尖科技企业,为中国消费者量身定制BMW新世代操作…

    2024年12月24日
    500
  • 见面礼100万美元 亚马逊创始人贝佐斯将与特朗普会面

    特朗普2017年与贝佐斯 凤凰网科技讯 北京时间12月13日,据《华尔街日报》报道,亚马逊公司计划向美国候任总统特朗普的就职基金捐赠100万美元。眼下,亚马逊创始人杰夫贝佐斯(Jeff Bezos)和其他科技行业领袖正努力加强与即将上任的新政府的关系。 据知情人士透露,亚马逊正在准备这笔捐赠,其执行董事长贝佐斯预计将于下周前往佛罗里达州棕榈滩的特朗普私人俱乐…

    2024年12月13日
    2200
  • 全球首例!中国完成2000多公里隔空切除子宫手术 网络延迟仅40ms

    11月30日消息,四川大学华西第二医院与西藏自治区妇产儿童医院日前共同完成了一项跨越成都至拉萨、全程超过2000公里的远程机器人手术。 此次手术由华西二院妇产科主任郑莹教授主导,她通过远程操作单臂单孔腔镜手术机器人,为位于拉萨的一位妇科患者成功实施了全子宫切除术及双侧输卵管切除术。 尽管面临3000米高海拔和近2000公里距离带来的技术挑战,郑莹教授依然能够…

    2024年11月30日
    5000
  • 阿里挥刀“斩”银泰

    阿里出售非核心资产的第一锤终于落下。 12月17日,阿里公告称,公司与另一名少数股东同意将银泰百货100%股权向由雅戈尔集团和银泰管理团队成员组成的购买方财团出售,阿里就银泰出售的所得款项总额约为74亿元,预计因出售银泰而录得的亏损约为93亿元。 雅戈尔方面向媒体表示,本次集团与银泰管理层共同投资银泰,旨在“强链补链”,完善时尚生态圈。投资完成后,雅戈尔集团…

    2024年12月18日
    2100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信