7月17日消息,據媒體報道,包括NVIDIA、蘋果、Salesforce和Anthropic在內的多家科技巨頭,被曝光涉嫌違規(guī)使用數據,用于訓練其AI模型。
這些公司被發(fā)現使用了超過173536個YouTube視頻的字幕數據,而這些數據的獲取并未得到視頻創(chuàng)作者的許可。
這些公司所使用的數據集名為“YouTube Subtitles”,由非營利組織EleutherAI創(chuàng)建,該數據集包含了來自超過48000個頻道的視頻文本。
其中不乏知名教育機構和媒體公司的內容,例如可汗學院、麻省理工學院、哈佛大學等,此外,一些廣受歡迎的YouTube創(chuàng)作者,如MrBeast等的視頻也被包括在內。
此前,EleutherAI發(fā)布了名為“Pile”的數據匯編,其中的大部分數據集都是對公眾開放的,包括YouTube Subtitles。
不過值得注意的是,蘋果在使用Pile數據集訓練OpenELM模型時,并未直接下載數據,因此在技術層面上,是EleutherAI違反了YouTube的使用條款。
YouTube明確禁止未經授權從平臺獲取素材,同時這些數據不僅用于訓練AI,還可能涉及到版權和隱私問題。
創(chuàng)作者們也對此表示震驚和不滿,因為他們并未被告知自己的作品被用于商業(yè)目的,更遑論從中獲得任何補償。
發(fā)布日期: 2024-02-06
發(fā)布日期: 2024-04-12
發(fā)布日期: 2024-07-19
發(fā)布日期: 2025-02-11
發(fā)布日期: 2024-05-16
發(fā)布日期: 2024-05-07
發(fā)布日期: 2024-05-16
發(fā)布日期: 2024-04-24
發(fā)布日期: 2025-04-24
發(fā)布日期: 2025-04-24
發(fā)布日期: 2025-04-24
發(fā)布日期: 2025-04-24
發(fā)布日期: 2025-04-24
尋找更多銷售、技術和解決方案的信息?
廣州綠測電子科技有限公司(簡稱:綠測科技)成立于2015年11月,是一家專注于耕耘測試與測量行業(yè)的技術開發(fā)公司。綠測科技以“工程師的測試管家”的理念向廣大客戶提供專業(yè)的管家服務。綠測科技的研發(fā)部及工廠設立于廣州番禺區(qū),隨著公司業(yè)務的發(fā)展,先后在廣西南寧、深圳、廣州南沙、香港等地設立了機構。綠測科技經過深耕測試與測量領域多年,組建了一支經驗豐富的團隊,可為廣大客戶提供品質過硬的產品及測試技術服務等支持。
技術工程師
020-22042442