王小川的百川智能发布全链路领域增强金融大模型,准确率超过GPT-4o

(图片来源:钛媒体AGI编辑林志佳拍摄)

“大模型六虎”加速内卷,百川智能公布金融垂直领域模型。

12月23日消息,钛媒体AGI获悉,王小川创立的通用 AI 公司百川智能今天发布全链路领域增强大模型Baichuan4-Finance。在高质量金融数据的基础上,通过行业首创自约束训练方案,Baichuan4-Finance实现金融能力和通用能力,极大提高金融场景整体可用性。其金融专业能力和场景应用能力大幅领先GPT-4o。

百川智能创立于2023年4月10日,由搜狗公司创始人、前CEO王小川创立,旨在打造中国版的OpenAI,构建中国最好的大模型底座,帮助大众轻松、普惠地获取世界知识和专业服务,并在医疗与行业领域应用落地。截至目前,百川智能已相继推出16款大模型,涵盖开源、闭源、学术科研、国产算力等多个维度。

今年10月31日,百川智能宣布推出包括Baichuan4-Turbo、Baichuan4-Air两款模型在内的一站式大模型商业化解决方案,即1+3产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链)。

如今,百川智能向金融领域提供全新的大模型产品。

具体来说,中国人民大学财政金融学院12月17日发布的金融评测体系FLAME以及国内主流开源金融评测基准FinancelQ上,Baichuan4-Finance均登上榜首。其中,FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先金融领域公认的综合实力最强的通用模型之一GPT-4o、国内首个开源中文金融大模型XuanYuan3-70B-Chat,超出GPT-4o近20%。

同时,百川智能打造了一套全链路领域增强方案,该方案覆盖了高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程。同时,Baichuan4-Finance还在领域自约束训练过程中引入了更高精的通用数据,与高质量金融数据一起进行混合训练,最终实现了模型通用能力不下降,金融能力稳定增长的效果。此外,百川智能在后训练环节也做了大量增强工作,如:通过合成数据、指令数据对模型进行有监督的微调;在强化学习策略中,针对数学计算等金融领域特别关注的场景进行样本增强等,进一步提升了模型性能。

商业化层面,目前,百川智能已经服务了数千家客户,包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。

用友表示,Baichuan4-Finance凭借其海量的金融专业知识储备,在财税知识问答场景中,准确率较Baichuan4-Turbo提升了20%,较GPT-4o提升了10%,表现尤为亮眼;软通动力表示,自部署Baichuan4-Finance以来,其客户满意度提升了20%。

事实上,百川智能已经转向行业模型领域。百川智能创始人、CEO王小川早前表示,AGI 正在产生巨大的突破,但目前百川没有达到世界级的水平,只是有一定成绩,对自己来讲有 60 分吧。主要今天在现实和理解中得找到自己的一条道路,百川认为自己已经打明牌了,有实践的路径。

“定义什么是 AGI,其实有很多行业讨论,大家不断在上面加码。之前我们讨论‘机器怎么才算有智能?’以前是图灵测试,对话者分辨不出来是人还是机器,这就算智能了。到了今天,机器还要会解数学题,还要有主动学习的能力。我理解 AGI 是做到“像人一样”,像一个数字员工,能够在多个职业里产生工作成果。之前和一个技术大佬交流,他质疑当下的大模型,他说大模型七位数乘法都做不好。我反问‘你会吗?你拿着科技公司的股份,你也不会七位数的乘法,你为什么要求 AGI 会?’这是个审美问题,我们以前总是把 AGI 当成一个工具,它是超级计算机,能精确地做计算,或者跑程序跑得很快。但 AGI 本身,我觉得就像人一样,如果审美没有建立好,你怎么去评价它呢。AGI 正在产生巨大的突破,它的文章已经写得像最顶尖的文科生了,还可以写诗,随着 OpenAI o1 的推出,AI 有了更好的逻辑推理能力,文理双修。但它并不是上帝,它像一个极其聪明的人,但它现在真的知道宇宙规律吗?”王小川表示,AGI 现在还在飞速发展中。往后还有新的突破,发展速度并没有变慢。大家都过高期待这两年的速度,也许三五年后,就会非常不一样。而今天我们从互联网时代走入到了 AI 时代,他感觉很幸运,没有错过每一个时代。

对于 AI 搜索,王小川表示,虽然这能走出百度射程,甚至能够颠覆百度,但它依然在字节产品的射程里。“从竞争角度,在大厂的 DAU(日活跃用户)范畴内,我们还是处于弱势地位,在很多地方也搞不过小公司,他们对于需求敏感度的把握,会把腰部公司撕的粉碎,他们有很强的竞争力。反过来,医疗领域大家都认为是垂类,小公司不一定做的动,虽然上一代已经投了 1000 亿进去,投资人很多都失去信心了,但投资还在持续加大。”

王小川强调,医疗绝不只是垂直方向,它不仅与 AGI 是等价的,还代表着生命科学的未来想象。

“我们从今天的智能时代走向生命时代,可能会越走越广阔,医疗是当下特别好的,独有的一个卡位,但我相信在三年、五年后,大家会看到它不是个垂直方向,它可能代表更广阔的未来。”王小川称。

(作者|林志佳,编辑|胡润峰)

平台声明:该文观点仅代表作者本人,佐伊科技仅提供信息存储空间服务。发布者:rmltwz,转转请注明出处:https://www.rmltwz.com/keji/22757.html

(0)
rmltwz的头像rmltwz
上一篇 2024年12月23日 上午11:57
下一篇 2024年12月23日 上午11:57

相关推荐

  • 国标是25km/h:广州电动自行车为何限速15km/h 专家称事故太多

    12月9日消息,备受关注的《广州市电动自行车管理规定》将于2024年12月30日起施行,这引起了网友热议。 《规定》共8章55条,对电动自行车生产、销售、维修、登记、通行、停放、充电等管理作了全面规定,对政府相关部门的职责及电动自行车经营者、外卖即时配送等企业的义务和责任作了明确规定,对纠治电动自行车改装、超速、违章、火灾等乱象作了刚性规定。 此外,规定中还…

    2024年12月10日
    9000
  • 阿姨免费升级宽带后家里成“电诈中心”:已拨出几百通诈骗电话

    12月23日消息,据报道,家住上海临港的段阿姨报警,有个自称电信公司的人,说要来进行设备升级,不仅可以屏蔽诈骗电话,还能升级网速。 当天下午,所谓的工作人员如约而至,对段阿姨家的电话和路由器进行了所谓的升级。然而,升级完成后,段阿姨却发现家里的固定电话无法正常使用,这让她感到十分困惑。 事实上,这一切都是电信诈骗的惯用手段。电信公司在检测到段阿姨家的线路异常…

    2024年12月23日
    9700
  • 再次对大疆动手,美国若失去大疆,会失去什么?

    文/王新喜 路透社当地时间12月9日报道称,美众议院投票通过一项法案,大疆(DJI)和道通(Autel Robotics)这两家中国公司可能被禁止在美国市场销售新的无人机。这份长达1800页的法案声称,美国国家安全机构必须在一年内确定这两家企业的无人机是否构成“不可接受的国家安全风险”。 其实美国一直都知道自己离不开大疆,大疆公司早就表示,他们的产品已经通过…

    2024年12月12日
    12600
  • 雷军宣布12月31日举行围炉跨年直播:和大家聊聊今年难忘的事

    IT之家 12 月 29 日消息,小米创办人,董事长兼 CEO 雷军今日宣布,12 月 31 日晚 8 点,打算做一场围炉跨年直播。 雷军表示,2024 马上就要过去了,回望这一年,大家肯定都有不少感慨。如果你没有特别的安排,欢迎你来我的直播间,一起许个愿、聊聊天,比如,这一年来,你都经历过哪些有趣的事和难忘的事? 据IT之家此前报道,昨天(12 月 28 …

    2024年12月30日
    13100
  • 三哥玻璃心碎了!比尔盖茨将印度比作实验室引不满

    12月5日消息,据国外媒体报道称,前世界首富比尔盖茨的一句话,敲碎了印度网友的玻璃心。 报道称,比尔·盖茨在播客节目中表示,印度虽然存在诸多问题,但其健康、营养、教育状况正在得到改善,它就像是一个可以用来进行尝试的实验室,当一些举措在印度被验证可行后,就可以将它们推广到其他地方。 因此,我们基金会在美国之外最大的办事处就设在印度我们的合作方大多…

    2024年12月5日
    9600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信