首页 > 生活分享 > 免费教学 > 谷歌因违规收集训练数据领2.5亿欧元罚单,数据版权问题再引争议

谷歌因违规收集训练数据领2.5亿欧元罚单,数据版权问题再引争议

发布时间:2024-03-24 15:19:16来源: 15210273549

据央视新闻3月21日报道,法国市场监管机构日前宣布,已向美国谷歌公司开出一张2.5亿欧元(约合人民币19.7亿元)的罚单,原因是谷歌未经同意使用法国出版商和新闻机构的内容训练旗下的聊天机器人“巴德”(其升级版名为“双子座”),违反了欧盟知识产权的相关法规。谷歌就此成为了第一家因为训练数据而被罚款的人工智能(AI)公司。对此,学者向澎湃新闻(www.thepaper.cn)表示,谷歌遭到处罚,可能会导致今后出现越来越多类似的诉讼。

在AI技术更新迭代非常迅速的前提下,AI公司在获取训练大模型的数据时,如何界定获取语料的合法性?专家认为,目前数据权益保护问题仍存在模糊地带,但可以出台健全市场和管理的方法应对这些问题。

谷歌被首罚成先例,不排除有更多类似诉讼

报道称,法国监管机构表示,作为和解条件,谷歌对其违规行为不作辩解,并将提出有关措施,以修正产品和服务缺陷。谷歌对此回应称,希望寻求和解是因为“该往前走了”。“我们希望专注于更大的、可持续的方法,把用户和高质量的内容联系起来,并与法国出版机构进行建设性合作。但需要注意的是,监管机构没有充分考虑我们为解决问题所做的努力,因为在‘探索新路’的过程中,我们无法预测未来的风向。”

谷歌与法国出版机构之间的纷争,始于2019年。当时,法新社等多家法国媒体机构曾向监管机构投诉,称谷歌未经允许,擅自使用这些机构出版的网络内容。2020年,监管机构要求谷歌与相关出版机构就内容付费进行谈判,但因为谈判未果,监管机构于2021年向谷歌开出了5亿欧元的罚单。2022年,谷歌与相关媒体出版商达成和解协议。

在此次的声明中,监管机构称,谷歌违反了和解协议中的几项条款,包括与相关出版机构谈判、提供透明信息等。监管机构特别提到,谷歌利用媒体平台和新闻机构的数据,用于训练2023年推出的“巴德”,但未告知相关出版机构和监管机构。为此,监管机构表示,“对谷歌的AI服务感到担忧”。

因为此次争端,谷歌成为首家因为训练数据而被罚款的AI公司。在AI更新迭代迅速的前提下,谷歌的案例对于其他AI公司是一个警示,还是今后会有更多类似的诉讼?复旦大学计算机学院教授、复旦大学上海大数据实验室主任肖仰华向澎湃新闻表示,类似的诉讼可能会越来越多,这些诉讼可以被认为是AI产业发展过程中的必然问题。“AI发展核心在于数据,所以AI公司非常渴求高质量数据。在收集和使用数据的过程中,这些公司会加大数据收集力度,但会有意无意地侵犯其他主体的数据权益。另一方面,数据权益保护目前仍存在模糊地带,包括制度供给、实践案例等。”

从法律的角度看,上海交通大学媒体与传播学院教授陈堂发认为,法国监管机构对于谷歌的处罚具有法律依据,这对其他的AI公司应该具有警示功能,处罚行为表明AI研发及产品使用如果涉及大规模使用他人作品的训练,无疑存在法律风险。

传统媒体与AI公司之间的版权之争

为确保获得使用出版机构内容作为数据训练的许可,另一家科技公司OpenAI于2023年与美联社、德国媒体巨头Axel Springer等达成有关协议。不过,该公司没有与《纽约时报》就有关问题达成协议,因此在2023年12月被该报起诉。《纽约时报》称,OpenAI和科技巨头微软“非法复制和使用该报独特、有价值的作品”,要求两家公司销毁任何使用到该报版权材料的聊天机器人模型和训练数据。《纽约时报》表示曾与两家公司接洽,提出对他们使用其版权内容的担忧,并希望探索“友好的解决方案”,比如提出围绕生成式AI产品的商业协议等,但当时的谈判未得出解决方案。

《纽约时报》就此成为第一家就版权问题起诉AI公司的美国媒体。起诉内容显示,大量由该报刊发的文章被用作训练聊天机器人的数据,且有分析认为,这些聊天机器人正在与传统新闻出版平台竞争,同样希望成为“可靠的消息源”。此外,《纽约时报》还在诉讼中引用一些案例,表明一些在该报网站上需要付费订阅阅读的文章,ChatGPT等聊天机器人可以免费向用户提供。

目前的多项争端,多由《纽约时报》、法新社等媒体机构提起。肖仰华分析称,由于目前媒体界呈现出新媒体挑战传统媒体的局面,再加上生成式AI会侵犯传统出版机构的利益,因此传统媒体在这个问题上更敏感。

对于这项诉讼,OpenAI曾多次回应称“感到惊讶”,“因为双方本处于非常积极和富有成效的谈判中”。OpenAI方面表示,旗下的聊天机器人ChatGPT“不会成为代替订阅《纽约时报》的选项”,称“包括《纽约时报》在内的单一数据源,对大模型的预期学习并不重要,因为大模型是从人类知识的巨大集合中学习”

免费教学更多>>

iOS 18.5正式版两大亮点:发热解决、电池查清,更新体验超预期 苹果iOS 18.5正式版发布,带来多项新功能和错误性修复 谷歌将为安卓16引入90:10分屏模式 以提升移动设备多任务处理效率 全面搭载鸿蒙 5?华为nova 14系列将带来全新的鸿蒙AI体验 热搜!华为发布鸿蒙电脑新品预热海报 红魔电竞小平板即将发布 预计搭载骁龙8至尊版并内置散热风扇 华为发布会将推出鸿蒙折叠电脑,新品价格可能相对较高 华为不仅要做鸿蒙电脑 还要做可折叠鸿蒙电脑? 体验三星Galaxy S25 Edge 超轻薄旗舰风潮由此开启 三星炫技:Polygon Foldable概念折叠手机亮相,金属质感 AI驱动下的异构智能云架构,上海交大与联想产学研模式新突破 科技赋能物流!陇西:无人驾驶快递车投运 日均派件效率提升30% AI“押题”成备考“神器”?考前冲刺路,千万别走歪 AI在义乌,让小生意玩转大世界 3张照片→全景3D:苹果携手推出革命性AI模型Matrix3D Vivo 或许将凭借全新 S30 系列双雄解决其中端手机面临的最大抱怨 荣耀平板10新品即将上市,号称“解放家长的平板新物种” 荣耀内部进行“重新竞聘上岗”,新增AI新产业部门 一加平板2 Pro发布:骁龙8至尊版,国补后2719.15元起 TCL T7L Pro 75英寸实拍:蝶翼星曜屏 + 万象分区,旗舰配置下放 魅族 Note 16 系列价格公布:中端市场的“技术堆料”与定价阳谋 魅族21Note开箱上手!白面板,大屏幕,长续航,我全都要! 魅族Note 16系列发布,首销799元起,产品配置、价格一文汇总 真人人都买得起!魅族Note 16系列正式发布,产品配置和竞争力简析 魅族预热水月雨联名PANDAER“PILL音乐胶囊”耳夹式耳机 真我GT Neo7半年深度测评:优缺点大揭秘 iQOO Neo10 Pro+ 登场在即:创新设计融合多重顶尖配置 曝华为nova 14系列手机本月见 OPPO Reno14全面解析:颜值党的终极武器还是高价花瓶? 预算2000元怎么选?学生高性价比平板Top4,性能/续航/生态全解析