9.11比9.9大?消耗20万张英伟达GPU的Grok3,被一个简单数学问题“打脸”!马斯克:史上最聪明AI

(图片来源:摄图网)
2 月 18 日,马斯克 AI 公司正式发布新一代 AI 基座大模型—— Grok 3,并在直播间演示,吸引了全球人目光。
在发布会上,马斯克亲自揭晓了 Grok 3 的强大性能。据他透露,Grok 3 的计算能力相较于其前代 Grok 2 提升了 10 倍以上,累计消耗了 20 万张英伟达 GPU。这使得 Grok 3 能够更高效地处理大型数据集,不仅明显缩短了模型训练时间,还进一步提高了预测的准确性和效率。马斯克甚至表示,Grok 3 未来将用于 SpaceX 的火星任务计算。他预测,在三年内,Grok 3 将实现诺贝尔奖级别的科学突破。
前几天,马斯克发文称,Grok 3 具有极强的推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品,并称其为 "地球上最聪明的人工智能"。
此外,马斯克 AI 公司的 xAI 团队也透露了一些关于 Grok 3 的详细数据。尽管 Grok 起步较晚,但它在 MMLU 得分上却以惊人的速度追上了 ChatGPT。不仅如此,Grok-3 和 Grok-3 mini 在多方面性能上都超过或媲美了 Gemini、DeepSeek 和 ChatGPT 等竞争对手。
尽管 Grok 3 在发布会上大放异彩,但在实际测试中却遭遇了一个小插曲。有媒体在发布会后测试了最新的 Beta 版 Grok 3,并提出了一个经典的问题来刁难大模型:" 9.11 与 9.9 哪个大 ? "遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的 Grok 3 却未能正确回答这个问题。相比之下,同一个问题,DeepSeek 无论是在普通模式下还是开启深度思考 ( R1 ) 模式后,都给出了正确的答案。
大模型是指包含超大规模参数 ( 通常在十亿个以上 ) 的神经网络模型。这些模型基于神经网络结构构成,受到人脑神经系统结构的启发,由人工神经元 ( 节点 ) 和它们之间的连接组成。通过调整这些连接的权重,神经网络能够学习和适应输入数据的模式。近年来,全球大模型行业市场规模持续增长,2023 年已经达到了 210 亿美元。

当前,全球 AI 大模型行业正处于技术创新与商业化加速推进的阶段。OpenAI、Google、微软等美国企业在这一领域处于领先地位,主导着生成式 AI、自然语言处理等技术的发展,其模型如 GPT 系列和 PaLM 等已经得到了广泛应用。

中国工程院院士柴洪峰在"第五届 1024 资管科技开发者大会"上强调,大模型技术是时代发展的必然趋势,任何对其漠视都等同于放弃未来的发展机会,倡导业内人士积极拥抱大模型技术,共同推动产业的发展与变革,同时指出要警惕大模型带来的数据隐私、算法透明性等潜在风险和挑战。
清华大学人工智能研究院常务副院长孙茂松指出,大模型可以显著提升工作效率和效果是 AI 大模型被大量推出的重要原因之一。在处理数据体量庞大、具有高度复杂性和重复性的任务时,大模型表现尤为突出。大量耗费人力和时间的工作,如果落在了大模型能力可覆盖的范围内,借助大模型能够快速完成。
前瞻经济学人 APP 资讯组
更多本行业研究分析详见前瞻产业研究院《全球及中国大模型产业发展前景与投资战略规划分析报告》
同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO 咨询 / 募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容,请注明资料来源(前瞻产业研究院)。
更多深度行业分析尽在【前瞻经济学人 APP】,还可以与 500+ 经济学家 / 资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫 APP】,性价比最高功能最全的企业查询平台。
