防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎

快科技 2024-08-22 11:53:59新闻资讯
222

8月22日消息,据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。

百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、YYSpider和宜搜搜索(EasouSpider)等少数几个搜索引擎被允许抓取其内容。

百度百科.png

谷歌搜索、必应搜索、微软MSN、UC浏览器的Yisouspider以及其他一切搜索引擎爬虫均被明确禁止抓取百度百科的内容。

虽然360搜索没有在封禁列表中单独列出,但百度百科的策略是禁止一切非白名单爬虫抓取,所以360搜索和其他搜索引擎也都是被屏蔽的。

不过百度百科这种做法其实也只是防君子不防小人,肯定还有很多爬虫通过各种方式继续抓取内容然后拿去训练AI。

百度百科 谷歌 必应 搜索引擎
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

InfAlign:谷歌DeepMind推出的提升语言模型推理对齐能力的机器学习框架
随着人工智能技术的不断发展,生成式语言模型在各个领域的应用日益广泛。然而,这些模型在从训练到实际应用的过程中面临着诸多挑战。其中,如何在推理阶段使模型达到最佳表现...
2025-01-03 新闻资讯
138

个人站长如何友好转载文章而不受搜索引擎惩罚?
​在自媒体和网络内容创作的时代,个人站长在运营网站时,常常需要转载一些有价值的文章来丰富网站内容,吸引更多的读者和搜索引擎的青睐。然而,转载文章涉及到版权和原创性...
2025-01-03 站长之家
183

网站一次性发布大量文章是否会被搜索引擎视为采集?
在网站运营和内容优化的过程中,许多网站管理员和SEO从业者常常面临一个关键问题:一次性发布大量文章是否会被搜索引擎视为采集?这个问题不仅关乎网站的权重和排名,还涉及到...
2025-01-02 站长之家
161

必应(Bing)站长工具URL检查提示“无法编制索引”的原因及解决方法
在使用必应(Bing)站长工具进行网站优化和管理时,有时会遇到URL检查提示“无法编制索引”的问题。这一问题可能由多种因素导致,包括但不限于网站结构、内容质量、技术配置等方...
2024-12-31 站长之家
173

网站被必应(bing)限制展现没有排名怎么办?如何处理?
必应(Bing)作为微软旗下的搜索引擎,在全球范围内拥有庞大的用户群体。然而,有时候,网站可能会因为各种原因被必应限制展现,导致在搜索结果中没有排名。这不仅会影响网站的...
2024-12-26 站长之家
180

MegaSaM:谷歌DeepMind推出的相机跟踪和景深估计技术
MegaSaM是一个创新的计算机视觉技术,由谷歌深度学习团队和多所大学的研究人员联合开发。该技术旨在从动态场景的单目视频中准确、快速且稳健地估计相机参数和深度图。MegaSaM...
2024-12-25 新闻资讯
159