咨询热线:400-123-4567
您当前的位置: 天博体育 > 新闻中心 > 公司新闻
  NEWS

新闻中心

公司新闻

天博体育官网入口斯坦福学生AI团队致歉抄袭中国大模型 代码作者曾发声回应质疑:我

发布时间: 2024-06-14 次浏览

  天博体育官网入口斯坦福学生AI团队致歉抄袭中国大模型 代码作者曾发声回应质疑:我没有近日,由美国斯坦福大学三名学生组成的一个AI(人工智能)团队发布了开源模型Llama3-V,该模型很快被网友发现与中国大模型公司“面壁智能”的开源成果MiniCPM-Llama3-V 2.5拥有极为相似的模型架构与代码,引发“抄袭”质疑。

  当地时间6月3日,Llama3-V团队的其中两名成员森德哈斯·沙玛和阿克沙·加格通过社交平台X发表道歉声明,向“面壁智能”的MiniCPM团队正式道歉,并表示将从网上撤下这一模型。

  值得注意的是,前述道歉声明中提到,该模型代码的作者其实是团队的第三名成员——穆斯塔法·阿尔贾德里,该道歉声明还提到穆斯塔法“已经失联”。根据斯坦福大学官网显示,森德哈斯和阿克沙均为斯坦福大学计算机科学系的本科学生。

  穆斯塔法在社交平台X的账号已经开启了访客权限。其职业社交平台领英账号资料显示天博体育官方平台入口,穆斯塔法本科毕业于美国南加州大学的计算机科学系。值得注意的是,他现在的身份并不是学生。从2023年9月至今,其在一家名为“beehiiv”的公司担任软件工程师。据了解,该公司创立于2021年,专门为创作者和出版商提供软件构建服务。

  穆斯塔法曾为音乐公司设计过网站,也自创过AI博客生成器,还参与撰写了三本有关微积分的教科书。此外天博体育官方平台入口,穆斯塔法自学了彭博公司针对在校学生及金融行业新人设计开发的“彭博市场概念”(BMC)课程并获得了证书。

  红星新闻记者梳理发现,早在6月2日,在开源网站GitHub上,就有一个IP定位在中国厦门、用户名为“PZC163”的网友公开了整个“抄袭”事件的过程,并质疑斯坦福大学AI团队主导的Llama3-V开源模型抄袭“清华系创投”公司“面壁智能”的开源模型MiniCPM-Llama3-V 2.5。

  “PZC163”发文称,“MiniCPM-Llama3-V 2.5项目的作者,几天前我发现了一个令人震惊的事实。Llama3-V项目中有大量内容疑似是从MiniCPM-Llama3-V 2.5项目中窃取的,当我提出质疑后,Llama3-V的作者很快删除了我的帖子,并隐藏了Llama3-V项目的相关页面。我强烈质疑他们的所作所为,接下来我将公布所有证据,也敦促你们注意这一事件。”

  用户“PZC163”提出了三个证据:首先,其指出MiniCPM-Llama3-V 2.5和Llama3-V项目使用的模型结构和代码几乎是一模一样。其提到,Llama3-V的分词器与MiniCPM-Llama3-V 2.5完全相同。

  其次,“PZC163”强调穆斯塔法此前的回应有逻辑漏洞,其可以证明对方在撒谎。据悉,穆斯塔法曾回应称,自己在项目中使用了MiniCPM-Llama3-V 2.5的分词器,还称“我们在MiniCPM-Llama3-V 2.5发布前就已经开始了这项工作”。

  “PZC163”称,当自己质疑代码作者“如何在MiniCPM-Llama3-V 2.5发布前就使用MiniCPM-Llama3-V 2.5分词器”时,穆斯塔法辩称其使用的分词器来源于开源大模型网络平台Huggingface上的MinicPM-V-2分词器。“但事实是,MinicPM-V-2的分词器跟MinicPM-Llama3-V 2.5的分词器完全不一样。”

  最后,“PZC163”直指Llama3-V代码的作者完全不了解自己的代码,“比如说,感知器重采样器(Perceiver resampler)应该是单层交叉注意力,而不是双层交叉注意力”。

  在面对“PZC163”的质疑时,穆斯塔法一开始予以直接否认,并解释称:“我们在Llama3-V项目的代码版本管理中使用了MiniCPM-Llama3的配置,因为在我测试了很多配置后,发现MiniCPM-Llama3的配置与Llama3-V在Huggingface的Transformer库(注:开源Python编程库,其提供了数以千计的预训练Transformer模型,可广泛用于自然语言处理、计算机视觉、音频等各种任务)里进行模型训练时是匹配的。”

  穆斯塔法强调称,MiniCPM-Llama3的编程结构来自IDEFICS(Huggingface平台上开源的最先进视觉语言模型,可以接收图像和视频)。自己的Llama3-V项目是在研究了各个开源大模型的基础上,进行了创新。他还表示,如同MiniCPM-Llama3在基于IDEFICS开源模型结构上也有了自己的创新,这不能定性为抄袭。

  业内相关人士告诉红星新闻,这件事的症结在于Llama3-V项目团队没有遵守开源协议,“不同开源协议有不同的要求。有些不允许商用,有些必须标注出处。”根据美国法律,版权所有者对其作品(包括源代码)拥有专有权利。软件所有者可以基于开源协议,选择向用户提供源代码,并允许他们在开源许可下自由使用、复制和修改。但这些源代码及软件仍受版权保护,若不遵守协议条款,仍可能构成侵犯版权等违法行为天博体育官方平台入口

  Llama3-V团队在道歉声明中称,其已要求团队成员穆斯塔法提供训练代码,但目前未收到任何相关回应。

  有分析认为,目前来看,对于大模型“套壳”(抄袭)没有明确的界定。开源大模型以及开源社区的构建初衷,是促进技术的共享和交流、加速AI的发展,如果以这种直接“套壳”的形式使用,或许会与这一发展愿景背道而驰。

 
友情链接
天博tb·体育(中国)官方网站-登录入口

扫一扫关注我们

热线电话:400-123-4567  公司地址:广东省天博·体育登录入口
Copyright © 2012-2025 天博tb·体育(中国)官方网站-登录入口 版权所有HTML地图 XML地图   鲁ICP备16007669号-1