防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎

快科技 2024-08-22 11:53:59新闻资讯
169

8月22日消息,据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。

百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、YYSpider和宜搜搜索(EasouSpider)等少数几个搜索引擎被允许抓取其内容。

百度百科.png

谷歌搜索、必应搜索、微软MSN、UC浏览器的Yisouspider以及其他一切搜索引擎爬虫均被明确禁止抓取百度百科的内容。

虽然360搜索没有在封禁列表中单独列出,但百度百科的策略是禁止一切非白名单爬虫抓取,所以360搜索和其他搜索引擎也都是被屏蔽的。

不过百度百科这种做法其实也只是防君子不防小人,肯定还有很多爬虫通过各种方式继续抓取内容然后拿去训练AI。

百度百科 谷歌 必应 搜索引擎
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Google AdSense是什么?为什么有人会收购Google AdSense帐号?
Google AdSense不仅为网站所有者提供了一种有效的变现方式,还为广告主提供了精准的广告投放渠道。然而,随着市场竞争的加剧和广告收益的增加,一些人开始寻求通过收购现有的...
2024-11-23 站长之家
106

站长如何根据搜索引擎点击率(CTR)来判断网站内容质量?
网站运营是一个综合性的工作,需要站长从多个角度来分析网站的数据,并以此来优化网站。其中,搜索引擎点击率(Click-Through Rate,CTR)是衡量网站内容质量的一个重要指标。通...
2024-11-07 站长之家
138

网站已经被搜索引擎收录的内容为什么会突然消失?
在网站运营和内容管理的过程中,网站管理员们时常会遇到一个令人困惑的问题:明明已经被搜索引擎收录的内容,为何会在一段时间后突然消失?这一现象不仅影响网站的流量和排名,...
2024-10-31 站长之家
133

站长工具网:老网站突然不被搜索引擎收录的原因及解决方法
在互联网的世界里,搜索引擎收录对于网站的生存和发展至关重要。然而,一些老网站可能会突然面临不被搜索引擎收录的问题,这给网站的运营者带来了困扰。本文站长工具网将详细...
2024-10-27 站长之家
127

谷歌广告联盟提示“广告投放受到限制,无效流量”的原因及解决方法
谷歌广告联盟是一个广泛应用的在线广告平台,它为网站所有者和广告商提供了一种有效的盈利和推广方式。然而,许多网站所有者可能会遇到广告投放受到限制的情况,并收到关于无...
2024-10-22 站长之家
215

谷歌广告联盟(Google AdSense)审核一直不通过怎么办?
谷歌广告联盟(Google AdSense)是许多网站所有者和博主获取广告收入的重要途径。然而,审核不通过是一个常见的困扰,这可能会让网站所有者感到沮丧,尤其是当他们多次尝试仍未...
2024-10-21 站长之家
177