热点资讯

新闻动态

你的位置：十分组词 > 新闻动态 > 9.11比9.9大？消耗20万张英伟达GPU的Grok3，被一个简单数学问题“打脸”！马斯克：史上最聪明AI

9.11比9.9大？消耗20万张英伟达GPU的Grok3，被一个简单数学问题“打脸”！马斯克：史上最聪明AI

发布日期：2025-03-05 23:10 点击次数：69

（图片来源：摄图网）

2 月 18 日，马斯克 AI 公司正式发布新一代 AI 基座大模型—— Grok 3，并在直播间演示，吸引了全球人目光。

在发布会上，马斯克亲自揭晓了 Grok 3 的强大性能。据他透露，Grok 3 的计算能力相较于其前代 Grok 2 提升了 10 倍以上，累计消耗了 20 万张英伟达 GPU。这使得 Grok 3 能够更高效地处理大型数据集，不仅明显缩短了模型训练时间，还进一步提高了预测的准确性和效率。马斯克甚至表示，Grok 3 未来将用于 SpaceX 的火星任务计算。他预测，在三年内，Grok 3 将实现诺贝尔奖级别的科学突破。

前几天，马斯克发文称，Grok 3 具有极强的推理能力，在我们迄今为止所做的测试中，其表现优于我们所知的任何已发布产品，并称其为 "地球上最聪明的人工智能"。

此外，马斯克 AI 公司的 xAI 团队也透露了一些关于 Grok 3 的详细数据。尽管 Grok 起步较晚，但它在 MMLU 得分上却以惊人的速度追上了 ChatGPT。不仅如此，Grok-3 和 Grok-3 mini 在多方面性能上都超过或媲美了 Gemini、DeepSeek 和 ChatGPT 等竞争对手。

尽管 Grok 3 在发布会上大放异彩，但在实际测试中却遭遇了一个小插曲。有媒体在发布会后测试了最新的 Beta 版 Grok 3，并提出了一个经典的问题来刁难大模型：" 9.11 与 9.9 哪个大 ? "遗憾的是，在不加任何定语以及标注的情况下，号称目前最聪明的 Grok 3 却未能正确回答这个问题。相比之下，同一个问题，DeepSeek 无论是在普通模式下还是开启深度思考 ( R1 ) 模式后，都给出了正确的答案。

大模型是指包含超大规模参数 ( 通常在十亿个以上 ) 的神经网络模型。这些模型基于神经网络结构构成，受到人脑神经系统结构的启发，由人工神经元 ( 节点 ) 和它们之间的连接组成。通过调整这些连接的权重，神经网络能够学习和适应输入数据的模式。近年来，全球大模型行业市场规模持续增长，2023 年已经达到了 210 亿美元。

当前，全球 AI 大模型行业正处于技术创新与商业化加速推进的阶段。OpenAI、Google、微软等美国企业在这一领域处于领先地位，主导着生成式 AI、自然语言处理等技术的发展，其模型如 GPT 系列和 PaLM 等已经得到了广泛应用。

中国工程院院士柴洪峰在"第五届 1024 资管科技开发者大会"上强调，大模型技术是时代发展的必然趋势，任何对其漠视都等同于放弃未来的发展机会，倡导业内人士积极拥抱大模型技术，共同推动产业的发展与变革，同时指出要警惕大模型带来的数据隐私、算法透明性等潜在风险和挑战。

清华大学人工智能研究院常务副院长孙茂松指出，大模型可以显著提升工作效率和效果是 AI 大模型被大量推出的重要原因之一。在处理数据体量庞大、具有高度复杂性和重复性的任务时，大模型表现尤为突出。大量耗费人力和时间的工作，如果落在了大模型能力可覆盖的范围内，借助大模型能够快速完成。

前瞻经济学人 APP 资讯组

更多本行业研究分析详见前瞻产业研究院《全球及中国大模型产业发展前景与投资战略规划分析报告》

同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO 咨询 / 募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容，请注明资料来源（前瞻产业研究院）。

更多深度行业分析尽在【前瞻经济学人 APP】，还可以与 500+ 经济学家 / 资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫 APP】，性价比最高功能最全的企业查询平台。

上一篇：ST华微：收到证监会吉林监管局《行政处罚事先告知书》

下一篇：辛集：提取公积金付首付购房“首关”不再难