首页 > 综合推荐

马斯克兑现开源承诺，全球最大开源AI模型Grok-1来了，免费可商用

2024-05-11 -

马斯克开源了世界上最大的人工智能模型：Grok-1

马斯克旗下的人工智能初创公司xAI昨天宣布，其Grok-1模型正式开源，标志着全球最大的开源大模型的诞生。

这个拥有3410亿个参数的自研模型不仅兑现了马斯克上周的承诺，其参数数量也远远超过了GPT-3.5模型的1750亿个。

Grok-1采用混合专家（MoE）模型架构，开放其权重和网络架构，并遵守2.0协议。它成为迄今为止参数数量最多的开源大语言模型，体现了马斯克对开源社区的支持。

探索 Grok-1：MOE 架构的巨无霸

Grok-1由马斯克的xAI团队开发，是一种采用混合专家（MOE）架构的创新模型。这种架构汇聚了各个领域专家的智慧，当遇到特定任务时，门控网络决定将其分配给哪位专家，从而提高处理效率，同时保持高效的学习和推理能力。

不冷笑话第1337期_冷笑话大合集_冷笑话2021

Grok-1 有 3140 亿个参数，其中每个 token 只激活了 25% 的权重。这种设计大大提高了模型的运行效率和灵活性。

自 2023 年 10 月起，xAI 开始在基于 JAX 库和 Rust 语言的自定义训练堆栈上从头开始训练 Grok-1。尽管具体测试结果尚未公布，但Grok-1的性能和应用潜力已引起业界广泛关注。这种开源遵循 2.0 许可证，意味着个人和商业用户都可以自由使用、修改和分发 Grok-1。这种开放性将进一步促进模型的创新和应用。

在技术实现方面，Grok-1的模型权重和架构现已在互联网上开源。源权重数据约为300GB。迄今为止，该项目已获得 13,800 颗星。

为了运行 Grok-1，用户需要下载并遵循存储库中的 JAX 示例代码，但请注意，由于 Grok-1 体积较大（314B 参数），运行模型需要具有足够 GPU 内存的机器。据估计，要想顺利运行 Grok-1，可能需要至少有 628GB GPU 内存的机器。

Grok的发展历史

Grok 的旅程开始于 2023 年 7 月 12 日，当时马斯克的 xAI 团队宣布成立并启动了他们的第一个项目。

冷笑话2021_冷笑话大合集_不冷笑话第1337期