Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率
作者:方泰攻略站时间:2025-04-06 13:38:56
本站 4 月 6 日消息,Meta现已发布旗下最新Llama 4 系列AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth,Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛的视觉理解能力”。
目前,Meta 已将系列模型中的 Scout 和Maverick 上架到Hugging Face(点此访问),而 Behemoth 模型则还在训练中。其中 Scout 可以在单个英伟达H100 GPU 上运行,而Maverick 则需要英伟达H100 DGX AI 平台或“同等性能的设备”。
Meta 表示,Llama 4 系列模型是该公司旗下首批采用混合专家(MoE)架构的模型,这种架构在训练和回答用户查询时的效率更高,所谓“混合专家架构”基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的“专家”模型。
例如,Maverick 总共有4000 亿个参数,但在128 个“专家”模型中只有170 亿个活跃参数(参数数量大致与模型的问题解决能力相对应)。Scout 有170 亿个活跃参数、16 个“专家”模型以及总计1090 亿个参数。
不过值得注意的是,Llama 4 系列中没有一个模型是像OpenAI 的o1 和o3-mini 那样真正意义上的“推理模型”。作为比较,“推理模型”会对其答案进行事实核查,并且通常能更可靠地回答问题,但因此也比传统的“非推理”模型花费更长的时间来给出答案。
Meta 内部测试显示,Maverick 模型最适合用于“通用AI 助手和聊天”等应用场景,该模型在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试中表现超过了OpenAI 的GPT-4o 和谷歌的Gemini 2.0 等模型。然而 Maverick 与谷歌的 Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet 和OpenAI 的GPT-4.5 等功能更强大的最新模型相比仍有一定进步空间。
而 Scout 的优势则是总结文档、基于大型代码库进行推理。该模型支持 1000 万个词元(“词元”代表原始文本的片段,例如单词“fantastic”可拆分为“fan”、“tas”和“tic”),因此一次可以处理“多达数百万字的文本”。
本站注意到,Meta 还进一步预告了其 Behemoth 模型,据该公司称,Behemoth 有2880 亿个活跃参数、16 个“专家”模型,总参数数量接近2 万亿个。Meta 的内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth 的表现优于GPT-4.5、Claude 3.7 Sonnet 和Gemini 2.0 Pro,但不如Gemini 2.5 Pro。
相关文章
-
WinRAR 旧版本存安全漏洞,可绕过 Windows 安全警告执行恶意软件
本站 4 月 7 日消息,WinRAR 作为电脑用户中广受欢迎的压缩软件,数十年来一直为用户提供便捷的数据压缩服务,方便用户将文件压缩成更小的体积以便于传输。然而,除最新版外的所有 WinRAR 版本
-
苹果 iPhone 17 Pro 系列新机模渲染曝光,直观展示后置“横向大矩阵”摄像头模组设计
本站 4 月 7 日消息,博主@数码闲聊站 发布一张机模渲染图,展示了苹果即将推出的iPhone 17 Pro系列手机设计,直观展示了该机“横向大矩阵”摄像头模组,考虑到该博主发布内容有较高准确度,该
-
科学家利用细菌修复月球砖块裂缝,助力月球基地建设
本站 4 月 7 日消息,建设月球基地一直是人类太空探索的重要目标之一,而如何利用月球本地资源降低成本是关键问题。近期,印度科学研究所(IISc)的一项新研究为月球基地建设带来了新的希望,该研究基于月
-
古尔曼称苹果公司不会在美国组装 iPhone:成本太高
本站 4 月 7 日消息,彭博社的马克・古尔曼发文,认为在美国当局最新关税政策下,苹果公司仍然不会在这几年内将iPhone手机生产转移到美国本土,这主要是因为成本太高。古尔曼认为,苹果公司会与其供应链
-
全国首个,深圳海关智能查验机器人引入“满血版”DeepSeek-R1
本站 4 月 7 日消息,据科技日报本月消息,深圳海关自主研发的智能查验机器人已引入海关系统全国首个“满血版”DeepSeek-R1,实现技术升级,并在进口危化品监管和水果通关领域形成示范。据介绍,在
-
2025 清明档新片票房破 3 亿,《我的世界大电影》《向阳・花》《不说话的爱》位列前三
感谢本站网友 雨雪载途 的线索投递! 本站 4 月 6 日消息,据猫眼专业版数据,2025 年 4 月 6 日 17 时 20 分,2025 年清明档新片