当前位置:首页 > 外汇资讯 > 正文内容

Llama 3王者归来,可与GPT-4分庭抗礼,开源模型即将追上闭源模型了?

激石外汇2024-04-19 11:54:12外汇资讯302

激石Pepperstone(https://www.paraat.net/)报道:

4月18日,AI圈再迎重磅消息,Meta带着号称“有史以来最强大的开源大模型”Llama 3登场了。

Meta本次开源了Llama 3 8B与70B两款不同规模的模型,供外部开发者免费使用,未来几个月,Meta 将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型。其中,大版本的Llama 3将有超过4000亿参数有望与Claude 3“一较高下”。

同时,Meta首席执行官扎克伯格宣布,基于最新的Llama 3模型,Meta AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单独开启了网站,还有一个图像生成器,可根据自然语言提示词生成图片。

Llama 3的出现直接对标OpenAI的GPT-4,与“并不Open”的OpenAI截然不同,在AI圈围绕开源或闭源的路线争论不休之时,Meta坚定沿着开源路线朝AGI的圣杯发起了冲锋,为开源模型扳回一局。

知情人士透露,研究人员尚未开始对Llama 3进行微调,还未决定Llama 3是否将是多模态模型。有消息称,正式版的Llama 3将会在今年7月正式推出。

Meta AI 首席科学家、图灵奖得主Yann LeCun一边为Llama 3的发布“摇旗呐喊”,一边预告未来几个月将推出更多版本,称Llama 3 8B和Llama 3 70B是目前同体量下,性能最好的开源模型。llama 3 8B在某些测试集上性能比llama 2 70B还要强。

就连马斯克也现身于该评论区,一句简洁的“Not bad”表达了对 Llama 3 的认可和期待。

英伟达高级科学家Jim Fan认为,Llama 3的推出已经脱离了技术层面的进步,更是开源模型与顶尖闭源模型可分庭抗礼的象征

从Jim Fan分享的基准测试可以看出,Llama 3 400B 的实力几乎媲美 Claude“超大杯”以及新版 GPT-4 Turbo,将成为“分水岭”,相信它将释放巨大的研究潜力,推动整个生态系统的发展,开源社区或将能用上GPT-4级别的模型。

公布当天恰逢斯坦福大学教授,AI顶尖专家吴恩达的生日,吴恩达直言,Llama 3的发布是自己这辈子收到过的最好的礼物,谢谢你Meta!

OpenAI创始成员之一、特斯拉前AI总监Andrej Karpathy也对Llama 3表达了赞许。作为大语言模型领域的先驱之一,Karpathy认为Llama3的性能已接近GPT-4 的水平:

Llama3是Meta 发布的看起来非常强大的模型。坚持基本原则,在可靠的系统和数据工作上花费大量高质量时间,探索长期训练模型的极限。我也对 400B模型非常兴奋,它可能是第一个 GPT-4 级别的开源模型。我想很多人会要求更长的上下文长度。

我希望能有比 8B 更小参数,理想规模在0.1B到1B左右的模型,用于教育工作、(单元)测试、嵌入式应用等。

Rebuy公司AI总监、深度学习领域的博士Cameron R. Wolfe认为,Llama 3证明了训练优秀大语言模型的关键在于数据质量。他详细分析了Llama 3在数据方面做出的努力,包括:

1)15万亿个token的预训练数据: 比Llama 2多7倍,比DBRX的12万亿个还要多;

2)更多代码数据: 预训练过程中包含更多代码数据,提升了模型的推理能力;

3)更高效的tokenizer: 拥有更大的词汇表(128K tokens),提高了模型的效率和性能。

在Llama 3发布后,小扎向媒体表示,“我们的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。”未来,Meta团队将会公布Llama 3的技术报告,披露模型更多的细节。

这场关于开源与闭源的辩论还远未结束,暗中蓄势待发的 GPT-4.5/5 也许会在今年夏天到来,AI领域的大模型之战还在上演。

扫描二维码推送至手机访问。

版权声明:本文由激石Pepperstone发布,如需转载请注明出处。

本文链接:https://www.paraat.net/news/2949.html

标签: Llama 3GPT-4
分享给朋友:

“Llama 3王者归来,可与GPT-4分庭抗礼,开源模型即将追上闭源模型了?” 的相关文章

马斯克五月底讲话首度披露:我非常担心破产!

激石Pepperstone(https://www.paraat.net/)报道:造车有多烧钱?连世界首富马斯克都表示有点吃不消了。 在特斯拉官方认可的车主俱乐部“硅谷特斯拉车主”周三发布的一份采访中,马斯克坦言,由于供应链中断和电池制造挑战限制了特斯拉的增产能力,在美国得州和德国柏林的新汽车工厂已...

如何看待30亿元逆回购操作?重点在价不在量

如何看待30亿元逆回购操作?重点在价不在量

激石Pepperstone(https://www.paraat.net/)报道: 核心观点 2022年7月4日央行公开市场公告称“为维护银行体系流动性合理充裕,2022年7月4日人民银行以利率招标方式开展了30亿元逆回购操作”,由于操作量较小,引起了市场广泛关注。我们提示,央行公开市场操作的重...

恒指、恒生科技双双跌超1% 新能源汽车股逆势拉升 蔚小理集体冲高

恒指、恒生科技双双跌超1% 新能源汽车股逆势拉升 蔚小理集体冲高

激石Pepperstone(https://www.paraat.net/)报道:7月6日,港股开盘走势分化,恒指低开0.35%,恒生科技指数涨0.14%。 随后,恒指、恒生科技指数跌幅双双扩大至超1%。 盘面上,科技股走低,石油股跌幅继续扩大,新能源汽车股持续走高。 科技股走低,京东跌幅一度扩...

大摩“美股大空头”:衰退比预期更严重,每个人都在想业绩会多惨,估值该如何下调

大摩“美股大空头”:衰退比预期更严重,每个人都在想业绩会多惨,估值该如何下调

激石Pepperstone(https://www.paraat.net/)报道:周二,美股低开高走,但市场对美国经济衰退的担忧情绪挥之不去。 摩根士丹利首席股票策略师、华尔街大空头迈克·威尔逊(Mike Wilson)在最新的报告中警告称: 美国经济增长正在大幅放缓,甚至将比我们预期的更为严重。...

A股走势分化 半导体、风电强势冲高 旅游、煤炭板块领跌

A股走势分化 半导体、风电强势冲高 旅游、煤炭板块领跌

激石Pepperstone(https://www.paraat.net/)报道:7月6日周三,A股三大指数涨跌不一,沪指小幅低开,创业板指收复上日失地。 截至目前,沪指跌0.44%,深成指涨0.14%,创业板指涨1.03%。 今日开盘,宁德时代、迈瑞医疗、亿纬锂能、阳光电源集体发力,创业板收复上...

不买了?马斯克单方面宣布终止收购,Twitter:你想得美

不买了?马斯克单方面宣布终止收购,Twitter:你想得美

激石Pepperstone(https://www.paraat.net/)报道:马斯克收购 Twitter 的交易,就像他在乔·罗根播客上抽的那支卷草一样,在他享受完整个过程之后,化作一团烟,消失不见了。 就在刚才,这位世界首富给美国证券交易委员会 SEC 和 Twitter 法务部门发了一封信,...