不知何时,Google 的搜索结果中出现了大量垃圾搜索结果,尤以”小 X 知识网 “和“小 X 百科网” 最为猖獗。
点进任意一个此种网站,发现基本都是营销号套话,和从别处随意复制粘贴来的内容——几乎都没有原文链接,更几乎不可能事先申请过转载授权。据称这种网站一般被称作” 内容农场 “,专门发布垃圾文章,同时大搞 SEO,因此搜索结果通常很靠前。
之后从 V2EX 找到了 Chromium 插件 uBlacklist(被墙,不过对于 Google 用户应该不是问题),用于屏蔽 Google 等几个搜索引擎中的特定搜索结果,眼不见心不烦。同时支持 Firefox 和 Safari。
安装后,Google 的每个搜索结果旁都会显示 “加入黑名单” 按钮,而在浏览某个网页时,你可以点击插件栏的 uBlacklist 按钮,将正在浏览的网站加入黑名单。加入黑名单的域名或子域名,将会被从搜索结果中剔除,同时在搜索界面显示“uBlacklist 已经屏蔽了 x 个网址”,其中域名和子域名遵循 Mozilla 匹配模式(格式如 ://search.bilibili.com/
。Google 有时会在搜索结果中包含 B 站搜索的网页,而如果我需要视频结果我会使用站内搜索,所以这里将它屏蔽掉)。
实际上,我也一直苦于搜索结果中的 “程序员信息网”” 代码先锋网“之类网站,它们更像是纯粹的搬运(或者说,偷窃)各位博主的劳动成果。由于这种网站并不太多,简单的像上面这样域名屏蔽即可解决,大不了再屏蔽就是了。此外,华为云社区有时也会干这种不三不四的事情,搞不懂是为什么,反正一起被我屏蔽了。
但这些 “小 X 知识网” 实在太多了,有的域名都没注册直接拿 IP 地址就出来污染,靠域名根本屏蔽不完,怎么办?uBlacklist 还支持标题屏蔽,更支持正则表达式,格式如 title\your_regex\
。直接添加 title\ 小. 知识网 \
和 title\ 小. 百科网 \
,搜索结果马上就清净了。
想一劳永逸?在下面的 V2EX 原帖链接中,一些网友还提供了规则订阅链接,免于手动配置屏蔽,威力比较大,可能误伤。
或者你也可以尝试”Content Farm Terminator“插件,它能够一定程度上自动屏蔽这类内容农场网站。
danny0838/content-farm-terminator
参考:
请问在 google 搜索时,频繁遇到小 X 知识网等内容农场式结果,怎么办? - V2EX
亿点碎碎念
作为互联网汪洋大海的一个小透明网站,不知道我的文章有没有落入这类网站的魔爪之中。
我个人是反感这种做派的,但鉴于本站的文章默认遵守 CC BY-SA 4.0 协议(后续会在网站更多文章中有更明显的体现),只要注明来源、许可没问题那我也不好干涉,所以如果您碰巧发现疑似我的文章被盗而未标明出处,欢迎直接在本文下方发送评论,我将尽量投诉此类网站,在此不胜感激。当然,懒得帮也没关系,还是感谢您能抽时间观看本文 :)
不知道这些网站为什么要这么做,搞不懂盈利方式。