网络服务

最强开源大模型!Llama 3下周见?

来源:网易科技报道    作者:      2024年04月09日 14:35

导语:援引一位Meta员工消息报道称,该公司计划在下周推出两个小型的Llama 3大语言模型。

当地时间周一,科技媒体The Information援引一位Meta员工消息报道称,该公司计划在下周推出两个小型的Llama 3大语言模型(LLM),作为夏季推出正式版Llama 3的先行版本。

这两个小模型的发布,预计将为Llama 3的正式亮相进行铺垫。Meta在去年7月份发布了Llama 2,此后,包括谷歌、马斯克旗下的xAI与Mistral等在内的数家公司发布了开源的大语言模型,竞争十分激烈。

Llama 3直接对标OpenAI的GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。

报道称,正式版Llama 3也将支持多模态处理,即同时理解和生成文本及图片;而先行推出的两个小版本则不具备这一能力。

一般而言,较小的模型成本更低,运行更快,尤其在运行大型模型成本高昂的当下,其价值尤为凸显。小型模型还便于开发者移动设备上开发人工智能软件。

Meta此前已推出三个版本的Llama 2,其中最大的一个拥有700亿个参数,另外两个版本分别拥有130亿和70亿个参数。

据硬AI此前文章,Llama 3的最大版本可能会拥有超过1400亿个参数。

Meta还将在Llama 3中改进Llama 2在响应争议性话题时过于保守的问题,研究人员计划放松大模型在这一方面的限制,以便它更多地与用户互动,提供背景信息,而不仅仅是拒绝回答。



(文章为作者独立观点,不代表艾瑞网立场)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号