Meta阻止了Apple爬虫程序从Ins和Facebook抓取数据训练其 AI模型

文章4个月前更新 admin
121 0

Meta阻止了Apple爬虫程序从Ins和Facebook抓取数据训练其 AI 模型

其他知名新闻网站和社交媒体平台(包括《纽约时报》、Vox Media、Tumblr《大西洋月刊》和康泰纳仕)也选择不允许苹果使用其数据进行人工智能训练。
Applebot 抓取数据是为了改进 Siri 和 Spotlight(Apple 的搜索工具),但Applebot-Extended 抓取数据专门用于 AI 训练,并且还允许发布商选择不为此目的抓取其内容。
Applebot-Extended(三个月前刚刚推出)让出版商可以轻松退出该计划,因为他们所需要做的就是更新一个可公开访问的文本文件-称为 robots.txt.
Meta阻止了Apple爬虫程序从Ins和Facebook抓取数据训练其 AI模型只有 6-7% 的高流量网站屏蔽了 Applebot-Extended,只有 25%的新闻媒体屏蔽了它们,而屏蔽 OpenAl 网络爬虫的比例为 53%,屏蔽谷歌的网络爬虫的比例为 43%,这可能表明公司还不知道苹果的选择退出计划。
他们要做的就是更新可公开访问的robots.txt文件,这样机器人将无法从他们的网站收集数据并将其用于 AI训练。

© 版权声明

暂无评论

暂无评论...