倒反天罡!美国名校斯坦福AI团队抄袭中国大模型

作者:一号 编辑:美美 中国大模型被抄袭,怎么不算是某种层面上的国际认可呢? 5月29日,斯坦福大学的一个AI研究团队发布了一个名为「Llama3V」的模型,号称只要 500 美元就能训练出一个

作者:一号

编辑:美美

中国大模型被抄袭,怎么不算是某种层面上的国际认可呢?

5月29日,斯坦福大学的一个AI研究团队发布了一个名为「Llama3V」的模型,号称只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

图片

论文作者一共有三位,分别是Mustafa Aljaddery、Aksh Garg、Siddharth Sharma,其中两位来自斯坦福,并且集齐了特斯拉、SpaceX、亚马逊还有牛津大学等各种机构的相关背景,在外人看来,这是典型的业界大牛。所以宣布发布这个模型的推文很快浏览量就超过了30万,这个项目也冲到了Hugging Face的首页,而且别人试用了一下,效果是真的不错。

但是这个大模型最近却“删库跑路”了,怎么回事呢?

美国名校居然抄袭中国大模型?

在Llama3V发布后没几天,在X平台还有Hugging Face上就出现了一些怀疑的声音。有人认为,Llama3V实际上是“套壳”了面壁智能在5月中旬发布的8B 多模态小模型 MiniCPM-Llama3-V 2.5,但并没有在Llama3V的工作中表达过任何对 MiniCPM-Llama3-V 2.5的致敬和感谢。

图片

面壁智能是一家中国AI大模型公司,其核心团队成员包括来自清华大学自然语言处理与社会人文计算实验室 (THUNLP)的成员,如 CEO 李大海、联合创始人刘知远等。

对此,这个斯坦福AI团队回应称,他们「只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer」,并「在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作」。然而求锤得锤,随着好心网友的深挖,发现这两个模型的模型结构、代码、配置文件,简直一模一样,只是改了变量名而已。

图片

但是,网友摆出证据质疑Llama3V团队后,团队采取的做法却是删评删库,不少跟这个项目相关的网页,不管是GitHub还是Hugging Face,统统都变成了404。摆证据不听,那网友就找到的事件的另一当事方,也就是面壁智能那里,把一系列的证据都亮了出来。

面壁智能一看,就让这两个模型做了测试,发现这两个模型「不仅正确的地方一模一样,连错误的地方也一模一样」,这如果还是巧合就有点说不过去了。随后他们找到了一个关键性证据,那就是识别清华简。这个实际上是MiniCPM-Llama3-V 2.5的特有功能之一。

清华简是一种非常罕见、在战国时期写在竹子上的中国古代文字。他们在训练的时候,使用的图像是从最近出土的文物中扫描得来的,而面壁智能进行了标注。因此,可以说,除了面壁智能,其他的大模型基本上并不会具备这一功能。况且Llama3V还是美国团队研发的,按理说应该并不会特意去做这一个功能。但是,实际上,Llama3V和MiniCPM-Llama3-V 2.5的识别情况极其相似,这基本就是实锤了。

图片

证据面前,认错态度却很迷

种种证据面前,斯坦福的这个团队依旧不承认抄袭,而是选择下架了几乎所有与Llama3V相关的项目,但却做了下面的声明:

图片

非常感谢那些在评论中指出与之前研究相似之处的人。

我们意识到我们的架构非常类似于OpenBMB的“MiniCPM-Llama3-V 2.5,他们在实现上比我们抢先一步。

我们已经删除了关于作者的原始模型。

但随后又光速滑跪,项目其中的两位作者Siddharth Sharma以及Aksh Garg和另一位作者,来自南加利福尼亚大学的Mustafa Aljadery切割,指责其为项目编写了代码,但没有告知她们有关面壁智能的事,他们两个人更多只是帮助他推广这个模型。

图片

这让不少网友嘲讽,靠发发推文推广下就能成为项目作者之一,这名头来得也太简单了。因此,斯坦度人工智能实验室主任Christopher Manning下场开喷,说这是“典型的不承认自己错误!”

图片

对此,面壁智能CEO在昨天回应称“也是一种受到国际团队认可的方式”,首席科学家刘知远也表示,“该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉”。

中国大模型缺少国际团队认可

尽管本次事件具有极大的戏剧性,但实际上,这个事件之所以能引起人们的注意,主要是因为Llama3V不仅有名校名企的背书,而且确实拥有不错的实力,但这也引起了人们的反思。

谷歌DeepMind研究员、ViT作者Lucas Beyer提到,Llama3-V是抄的,但成本低于500美元,效果却能直追Gemini、GPT-4的开源模型确实存在,那就是面壁智能的MiniCPM-Llama3-V 2.5,然而,相比起Llama3V,MiniCPM得到的关注要少得多。主要原因似乎是这样的模型出自中国实验室,而非常春藤盟校。

图片

而Hugging Face的负责人Omar Sanseviero也说,社区一直在忽视中国机器学习生态系统的工作。他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情。

包括Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、InternLM、OpenBMB、Skywork、ChatTTS、Ernie、HunyunDiT等等。

图片

的确,从大模型竞技场上来看,中国的大模型实际上表现并不差,例如来自零一万物的Yi-VL-Plus在模型一对一PK的视觉大模型竞技场中排名第五,超过了谷歌的Gemini Pro Vision,智谱AI和清华合作的CogVLM也跻身前十。而在其他项目的比试中,中国大模型也往往榜上有名。

图片

即使具备这样的实力,但国产大模型不仅在国际上不受待见,在国内也常常深陷舆论泥淖,被贴上了“别人一开源,我们就自主”还有“套壳”等标签。而这次事件,可以很好地说明,实际上,中国大模型中也有一些出色的,尽管面对国际领先模型仍有显著差距,但中国大模型已经从以前的nobody,成长为了AI领取的关键推动者之一,一些关于中国大模型的成见需要被打破。

       原文标题 : 新火种AI|倒反天罡!美国名校斯坦福AI团队抄袭中国大模型

(来源:维科网)
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

相关推荐

  • 阿里蔡崇信:微软与OpenAI的未来可能分道扬镳

    快科技6月17日消息,据媒体报道,在摩根大通举办的第20届全球中国峰会上,阿里巴巴集团主席蔡崇信就AI与云计算的融合趋势发表了见解。 蔡崇信表示,AI和云计算的紧密结合非常重要,因为任何使用AI技术服务的人都离不开强大的云计算能力的支持

    2024-06-18
    0
  • 价格战迷雾下,大模型创业者只能被动挨打?

    如果说2023年是大模型的资格赛,融资额度决定了能否晋级,2024年已然快进到了淘汰赛的阶段。 字节跳动、阿里云、百度智能云、腾讯云等先后在5月中下旬加入“价格战”,轻量级模型直接免费,主力模型的API价格普遍下调了90%以上

    2024-06-17
    0
  • AI手机风口下,字节选择做手机厂商的大模型供应商

    ‍【摘要】字节做AI手机传闻的背后,其实是想做大模型供应商的逻辑。‍‍ 换句话说,AI手机对字节来说,重点在AI,不在手机。 盈利逻辑应

    2024-06-14
    0
  • WWDC来了:苹果AI大模型“虽迟但到”,ChatGPT将融入iOS

    紫金财经6月11日消息 一年一度的苹果开发者大会再次吸引全球的目光。 6月11日凌晨,在2024年的全球开发者大会(WWDC)上,苹果照例更新了iOS、iPadOS、MacOS和visionOS等操作系统

    2024-06-12
    0
  • 13名OpenAI与谷歌员工联合发声:AI失控可能导致人类灭绝...

    作者:小岩 编辑:彩云 2024年,OpenAI的CEO Sam Altman就没有清闲过,他似乎一直走在解决麻烦的路上。最近,他的麻烦又来了。 当地时间6月4日,13位来自OpenAI和Google Deep Mind的现任及前任员工联合发布了一封公开信,引发了外界的广泛关注

    2024-06-12
    0
  • 美国监管机构瞄准AI:将调查微软、OpenAI的垄断行为

    快科技6月10日消息,据媒体报道,去年初,ChatGPT吸引了无数网友的瞩目,迅速成为热议话题,并掀起了一场业界的人工智能(AI)竞赛。这场热潮也极大地推动了英伟达的营收与股价,实现了爆炸性增长。

    2024-06-11
    0
  • 运营商卷大模型,云厂商霸主地位不保?

    文|艺    思 编|王一粟 经过了2023年的小试牛刀,2024年,三大运营商带着大模型一路狂飙。 刚刚过去的5月,中国电信、中国移动、中国联通三大运营商集体完成了新一轮的大模型进化,特别是围绕大模型的研发与应用,展现了各自在技术革新和产业升级方面的最新成果

    2024-06-09
    0
  • 【维科杯】卡奥斯工业智能研究院参评“维科杯·OFweek 2024人工智能行业优秀AI赋能案例奖”

    维科杯· OFweek 2024(第九届)人工智能行业年度评选(OFweek 9th AI Awards 2024)由高科技行业门户举办已有十余年,作为高科技产业的核心评选活动,该评选是人工智能行业内的一大品牌盛会,亦是高科技行业具有专业性、影响力的评选之一

    2024-06-08
    0
  • 被扒用OpenAI牟私利, Altman到底在下哪一盘棋?

    引言你相信光吗?作为OpenAI创始人,Sam Altman已经头戴“硅谷新王”的桂冠。尽管前任Elon Musk宝刀未老,黄仁勋如日中天,但AGI带来的想象空间让Altman和他的OpenAI承载了世人对“光”的信念

    2024-06-07
    0
  • 2024高考再添黑科技,AI让作弊无所遁形

    作者 | 谢春生 春风得意马蹄疾,一日看尽长安花。 对于寒窗苦读十年的学子而言,这是梦寐之境,亦是动力之源。 如果说古时的科举,是寒门子弟“逆天改命”的唯一路径,那么如今的高考,则是莘莘学子“鱼跃龙门”的绝佳通道

    2024-06-07
    0