中国人工智能进步速度引美媒关注 AI模型将成为新的技术标签

中国AI模型正迎头赶上

凤凰网科技讯 北京时间12月25日,据《华尔街日报》报道,中国人工智能(AI)创业公司发布的大模型表明,他们追赶美国领先AI模型的速度要比业内许多人预期的更快

今年11月,深度求索公司(DeepSeek)发布了其最新大语言模型的预览版。该公司表示,该大模型在难度较高的数学和编程任务上超越了OpenAI在9月推出的预览版推理模型o1。

最近几周,其他中国公司也在其大模型性能方面也取得巨大进步。阿里巴巴和腾讯投资的创业公司月之暗面表示,它开发了一个专门研究数学的模型,性能接近o1。阿里表示,公司的一个实验研究模型在数学性能上优于o1预览版。

这些公司尚未发表介绍其模型的论文,因此难以评估这些说法,而目前还没有一个公认的统一测试方法来衡量AI模型的性能。不过,一些美国专家表示,中国公司在AI大模型上取得的进展令人印象深刻。

“中国正在以更快的速度赶上。”前OpenAI研究员、现AI企业家安德鲁卡尔(Andrew Carr)称。他表示,深度求索的研究人员尝试复制OpenAI的推理模型,“在几个月内就弄明白了。坦白说,我的许多同事对此感到惊讶”。

月之暗面创始人杨植麟表示,公司专注于强化学习,也就是模仿人类的试错过程。这种方法或许能够在提升模型性能的同时不需要那么多的算力。

月之暗面创始人杨植麟

自去年年底以来,AI开发人员越来越多地使用一种名为“混合专家”(MoE,Mixture of Experts)的模型技术。该技术的核心是通过组合多个“专家”模型来协同完成任务。每个“专家”都是一个独立的神经网络,它们各自负责处理不同的数据分布和任务类型。这些“专家”之间通过一种称为“路由”的机制进行交互,路由机制根据任务的特点和需求,将输入数据分配给最适合的“专家”进行处理。

腾讯表示,该公司在11月发布的MoE模型可媲美脸书母公司Meta在7月推出的Llama 3.1模型。审阅两家公司所发表论文的研究人员表示,腾讯训练模型使用的算力可能只有Meta的十分之一左右。

美国AI创业公司Anthropic的联合创始人杰克克拉克(Jack Clark)在其博客上称,中国公司的方法就是利用其能够获得的硬件,构建极其优秀的软件和硬件训练堆栈,中国制造将成为AI模型的一个标签,就像电动汽车、无人机和其他技术一样。”他表示。

中国AI创业公司正在自己所擅长的领域深耕。例如,深度求索专注于开源模型,强调数学和编程性能。月之暗面的聊天机器人Kimi类似于ChatGPT,擅长处理长文本,受到中国消费者的欢迎。

不过,中国AI创业公司目前的估值还远低于OpenAI等美国公司,原因是投资者不确定这些公司能否将其技术进展变现。而激烈的竞争中,AI模型供应商之间的价格战也已经出现。

知情人士称,智谱AI已推迟了最早于2025年下半年上市的计划,因为投资银行家告知该公司不太可能获得其期望的估值。智谱AI在本月最新一轮融资中的估值约为30亿美元。今年11月底,智谱AI展示了其AI智能体,并在7月发布了类似OpenAI Sora的视频生成模型。(作者/箫雨)

更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

平台声明:该文观点仅代表作者本人,佐伊科技仅提供信息存储空间服务。发布者:rmltwz,转转请注明出处:https://www.rmltwz.com/keji/23457.html

(0)
rmltwz的头像rmltwz
上一篇 2024年12月25日 上午9:58
下一篇 2024年12月25日 上午11:45

相关推荐

  • 男子持7枚皇家印章坐高铁:涉嫌诈骗、已被控制

    12月13日消息,离谱他妈给离谱开门,离谱到家的事情真就发生了。 据央视新闻报道,近日,济南铁路公安处曲阜东站派出所接到安检员报警称,有一名旅客行李中存在可疑物品,请求民警协助检查。 民警依法对旅客潘某的行李进行现场检查后,从包中找到7枚印有皇家等名头的印章和一沓国际皇家总指挥部公文,除此之外,潘某还有一叠伪造的国家机关红头文件。 内容颠三倒四、错字连篇,明…

    2024年12月13日
    2700
  • 苹果,马斯克的新“仇人”?

    OpenAI好像好久没有这么热闹了。 12天的直播活动还在进行着,目前进度条刚一半,就已经抛出了不少重磅消息。 Sora终于发布了,和苹果的合作也终于正式落地。当地时间12月12日,OpenAI宣布全面登陆苹果生态,可以运行苹果智能(Apple Intelligence)的设备现在可以无需注册一键呼出ChatGPT了。 与此同时,OpenAI的外界压力愈发的…

    2024年12月15日
    2900
  • 轻松超8000MHz C38!七彩虹iGame Shadow DDR5-6000 16GBx2评测:同时满足AMD/Intel的顶级内存

    一、前言:专为锐龙9000设计的顶级游戏内存 现在最火的游戏处理器无疑就是Zen5架构的锐龙9 9800X3D,它的游戏性能比起同时发售的酷睿Ultra 9 285K,领先了几乎整整2代。 我们都知道,内存延迟对于锐龙处理器非常重要,不过新一代的Zen5处理器在UCLK同频状态下,最高只能支持6200MHz或者6400MHz频率的DDR5内存。想要降低延迟,…

    2024年12月25日
    400
  • 突破垄断!32GB的DDR5内存跌破500元

    近日,金百达和光威两家公司在电商平台上推出了基于国产颗粒的DDR5内存条。这两款新品均为16GBx2套装,售价仅为499元。据官方介绍,这些内存条所使用的颗粒完全由国内生产。这两款DDR5内存条均为6000CL36规格,适用于台式电脑,频率为6000MHz(XMP),并支持英特尔XMP 3.0和AMD EXPO超频。同时,这两款产品的时序均为CL36,工作电…

    2024年12月23日
    1400
  • 阿姨免费升级宽带后家里成“电诈中心”:已拨出几百通诈骗电话

    12月23日消息,据报道,家住上海临港的段阿姨报警,有个自称电信公司的人,说要来进行设备升级,不仅可以屏蔽诈骗电话,还能升级网速。 当天下午,所谓的工作人员如约而至,对段阿姨家的电话和路由器进行了所谓的升级。然而,升级完成后,段阿姨却发现家里的固定电话无法正常使用,这让她感到十分困惑。 事实上,这一切都是电信诈骗的惯用手段。电信公司在检测到段阿姨家的线路异常…

    2024年12月23日
    1200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信