苹果AI内容抓取机器人被屏蔽
8月30日,《连线》杂志发表了一篇博客文章,揭示了一个有趣的现象:不少主流媒体开始拒绝苹果的数据抓取工具Applebot的访问。Applebot初次进入公众视野是在2014年11月,随后苹果在2015年5月正式公布了这一技术。作为Applebot的升级版,Applebot-Extended在过去十年间持续抓取网页内容,旨在提升Siri和Spotlight搜索等功能的表现。

近期的研究显示,多数主流出版机构通过robots.txt文件来限制苹果的抓取行为。据统计,大约有6%到7%的高流量网站已阻止了Applebot-Extended的访问。另一项由Ben Welsh进行的研究则指出,在他考察的网站样本中,有高达25%的网站对Applebot-Extended实施了屏蔽措施。此外,研究还发现,OpenAI的爬虫在新闻网站中的遭遇更为严峻,被53%的站点拦截,而谷歌的Google-Extended爬虫也被43%的网站拒绝。
《连线》分析认为,尽管网站或许并不介意苹果的智能搜索触及它们的内容,但Applebot及其增强版之所以被较低比例的网站阻挡,主要是因为这些机器人的知名度相对较低,尚未引起广泛的企业关注。



![伊朗遭袭小学死亡人数升至148人 惨无人道的暴行[热点]](http://www.wyjyhs.com/file/upload/202603/02/002639151.jpg)
![男子网吧包间打游戏遭陌生女子猥亵 突发状况令人震惊[热点]](http://www.wyjyhs.com/file/upload/202602/27/020324251.jpg)
![新郎说岳父退18.8万彩礼没提前彩排 现场感动众人[热点]](http://www.wyjyhs.com/file/upload/202602/26/015408241.jpg)
![童星小栓子真成了东北的骄傲 从银幕到赛场的传奇逆袭[热点]](http://www.wyjyhs.com/file/upload/202602/21/011119371.jpg)