格罗克3真的优于竞争对手产品?美媒展开对比
参考消息网2月22日刊文,援引美国科技时代网2月20日消息,埃隆·马斯克的xAI公司近期推出了新一代人工智能系统“格罗克3”,该企业宣称这一系统的表现要强于开放人工智能研究中心以及中国深度求索公司等同类机构的成果。然而,这一宣称是否属实,目前尚待验证。
让我们看看这款模型与现有的顶级AI模型相比如何。
xAI企业表示,“格罗克3”版本在核心性能评估上,要胜过o1版本以及深度求索的-R1版本。在聊天机器人比赛的匿名测试里,“巧克力”代号的“格罗克3”版本表现突出。这说明虽然它推出时间不长,却已经追平了业内顶尖水平。
安德烈·卡尔帕蒂是人工智能领域的开拓者,曾是特斯拉公司人工智能部门的负责人,也是该领域的早期参与者之一。他评估了“格罗克3”模型,并且把考察结果告知了他人。
据他讲,“深度搜索”推理能力配备的“格罗克3”模型,跟那些顶级模型例如每月需付200美元的o1-pro模型相比,表现不相上下,甚至略胜-R1一筹,但卡帕蒂指出,“格罗克3”模型尚不足以让用户终止他们当前的订阅。
意大利马沙布尔网站的一篇文章指出,虽然存在一些争议,但“格罗克3”模型的迅速发展是毋庸置疑的。谷歌在该领域起步更早,拥有长达13年的领先地位,而xAI公司仅在2023年才成立,其历史只有8年。即便如此,“格罗克3”模型已经作为顶尖的AI模型进入人们的讨论视野。
马斯克还提到,“格罗克3”模型运用了二十万个图形处理器,其所需的训练规模是“格罗克2”模型的十倍。这一情况再次证实了计算资源提升能够增强人工智能表现这一普遍现象。
然而,运算负担的加大,能否让人工智能获得更高智慧,从而跨过某个界限,这一点,加里·马库斯等人工智能研究者依然存有疑虑。
“格罗克3”模型虽然取得了显著发展,不过它依然面临着不少普遍存在于其他人工智能系统中的挑战,这些问题包括,
它的诙谐感表现不佳,跟其他多数人工智能系统一样,“格罗克3”系统在产生幽默时效果不彰,常常会说出一些平淡无奇的所谓“爆笑段子”。
制作SVG图形存在挑战:人工智能系统常对繁复的视觉构成感到吃力。虽然“格罗克3”系统较谷歌“双子座”1.5 Flash等系统更为出色,不过它处理错综的几何关联时依然不够完美。
对于AI和马斯克的追随者而言,“格罗克3”版本是人工智能界一个值得欢迎的新面孔。然而对于那些寻找最优秀AI解决方案的人,“格罗克3”版本目前或许还缺乏足够实力,无法吸引用户从其他行业顶尖产品转向使用它。
在美国某解密平台上,另一项评测显示,与众多AI对话程序对比,“格罗克3”版本给予的表述空间更为宽广。在开发操作层面,此款产品表现更佳。但就数学逻辑处理能力而言,它的表现仍不及同类其他方案。
德国勃兰登堡一处屏幕上显示的标志(德新社)
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。