新闻详细
新闻当前位置:新闻详细

科技巨头违规使用AI训练数据,竟用到苹果身上

转载:https://ai.zol.com.cn/884/8849590.html

2024-07-17 17:41:17·[??中关村在线 原创??]·作者:两三杯可乐

据媒体报道,近日有多家科技巨头涉嫌违规使用数据来训练其人工智能模型。其中包括NVIDIA、苹果、Salesforce和Anthropic等公司,他们被发现使用了超过173536个YouTube视频的字幕数据,并且这些数据的获取并未得到视频创作者的许可。

这个名为“YouTube Subtitles”的数据集是由非营利组织EleutherAI创建的,它包含了来自超过48000个频道的视频文本。其中不乏知名教育机构和媒体公司的内容,例如可汗学院、麻省理工学院、哈佛大学等,还有许多受欢迎的YouTube创作者的作品也被包括在内。

此前,EleutherAI发布了名为“Pile”的数据汇编,其中大部分数据集都是对公众开放的,包括YouTube Subtitles。然而值得注意的是,在使用Pile数据集训练OpenELM模型时,苹果并没有直接下载数据,所以在技术层面上EleutherAI违反了YouTube的使用条款。

因为使用未经授权从平台获取素材涉及到版权和隐私问题,YouTube明确禁止这样做。创作者们对此也表示震惊和不满,因为他们并未被告知自己的作品被用于商业目的,更遑论从中获得任何补偿。

本文属于原创文章,如若转载,请注明来源:科技巨头违规使用AI训练数据,竟用到苹果身上https://ai.zol.com.cn/884/8849590.html

Copyright2023同城维修科技