Grok
加拿大
AI 工具导航 聊天
Grok

马斯克旗下 xAI 团队发布的首个 AI 大模型产品

Grok 是马斯克旗下 xAI 团队发布的首个 AI 大模型产品,于 2023 年 11 月 5 日正式发布,被包含在 X 平台的 Premium+订阅计划中,有 Basic、Premium、Premium+三个版本供用户选择。它的名字来自海因莱因的小说《异乡异客》,代表全面深刻地理解事物。

发展历程

  • 2023 年 3 月,马斯克成立 xAI 团队,7 月正式启动。
  • 2023 年 11 月发布 Grok,12 月 7 日向美国的 Premium+订阅用户开放。
  • 2024 年 1 月计划发布 Grok 1.5,2 月 22 日表示于 2 周后发布,3 月 18 日正式发布了参数量达到 3140 亿的 Grok-1,这是迄今参数量最大的开源大语言模型,遵照 Apache 2.0 协议开放模型权重和架构。
  • 2024 年 4 月,马斯克表示希望在五月份完成对聊天机器人 Grok 下一版本的培训,5 月透露计划采用 10 万颗专业半导体芯片用于打造下一代对话式人工智能 Grok。
  • 2024 年 7 月,马斯克透露预计于 8 月发布 Grok 2,12 月发布 Grok 3。而在 2025 年 2 月 18 日中午,Grok-3 正式发布。

功能和现状

  • 产品功能:作为聊天机器人,具有幽默感,使用来自公开数据的数十亿个数据点进行训练,能通过联网获取实时信息,并浏览和使用 X 平台上的信息。其 SuperPrompt 上下文窗口大小为 25000 个 Tokens,知识库是 886.03GB 的“The Pile”的变种以及整个 X 平台,具有高响应时间,且支持语音。此外,部分功能如 API、图像生成、图像识别、音频识别等仍在开发中。
  • 产品现状:只训练了 2 个月,仍是一个处于初期的产品,在公司更广泛地发布之前可供部分用户进行测试。驱动 Grok 的引擎是 Grok-1,它在 Human Eval 代码生成任务上取得了 63.2%的准确率,在 MMLU 数据集测试中取得了 73%的准确率。但表现不如拥有更大训练数据和计算资源的模型,如 GPT-4。2024 年 7 月,Grok 1.5 版本仍基于 Grok 1 的训练成果,基础模型在性能上落后于 ChatGPT 一个数量级。8 月推出的 Grok 2 性能与 ChatGPT 的最新模型相媲美,极为接近。Grok 3 正在孟菲斯数据中心依托于 10 万块英伟达 H100 芯片的强大算力进行训练,目标是在 12 月份发布。

Grok 3 的特点

  • 引入“思维链”推理能力,可逐步处理复杂任务,提高处理复杂查询和提供连贯、有逻辑响应的能力。
  • 开发得益于使用由英伟达 H100 高性能 GPU 芯片组成的全球最大 AI 超算 Colossus 进行训练。
  • 采用合成数据集训练,解决数据隐私问题;具备自我纠正机制,可识别和纠正自身错误;具备强化学习能力,提高决策能力。引入人工反馈循环和上下文训练,以确保更自然和准确地响应。

产品目标:以“获得反馈并确保在创造能够最大程度上造福全人类的 AI 工具”和“为研究与创新提供推动力”,实现 AI 工具“能够帮助促进理解”为最终目标。

应用场景:会用幽默方式回答争议性问题,例如关于自制可卡因的询问等。

产品价格

  • Basic:3 美元/月或 32 美元/年。
  • Premium:8 美元/月或 84 美元/年。
  • Premium+:16 美元/月或 168 美元/年。与 Basic 计划相比,Premium+最大的差别是提供了无广告服务。

相关评价

  • 开源的大模型能使更多开发者参与改进和优化,推进技术进步,实现知识共享,有利于发现和解决问题,但也存在稳定性、社区支持、集成问题和安全风险等方面的挑战。
  • xAI 会对 openAI 产生较大冲击,其采用开源路径。在中国 DeepSeek 大模型推出后,引发了关于是否还需类似 xAI 这种利用“大规模堆芯片和算力”来推进 AI 发展的关注。

延伸信息

  • 2024 年夏天,马斯克曾表示 Grok 3 在测试中“表现优于任何已发布的产品”,“聪明得吓人”。
  • 2025 年 2 月 18 日的报道中提到,Grok 3 及其 mini 在多方面的测试得分上超过或媲美 Gemini 和 ChatGPT 等对手,还演示了生成代码并运行,以及制作类似于俄罗斯方块的游戏。此外,xAI 宣布推出名为 Deepsearch 的 Grok-3 智能搜索引擎。

总的来说,Grok 是一个具有一定特色和竞争力的 AI 大模型产品,其性能和功能在不断发展和提升中。

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...