不知何时,Google的搜索结果中出现了大量垃圾搜索结果,尤以”小X知识网“和“小X百科网”最为猖獗。
点进任意一个此种网站,发现基本都是营销号套话,和从别处随意复制粘贴来的内容——几乎都没有原文链接,更几乎不可能事先申请过转载授权。据称这种网站一般被称作”内容农场“,专门发布垃圾文章,同时大搞SEO,因此搜索结果通常很靠前。
之后从V2EX找到了Chromium插件uBlacklist(被墙,不过对于Google用户应该不是问题),用于屏蔽Google等几个搜索引擎中的特定搜索结果,眼不见心不烦。同时支持Firefox和Safari。
安装后,Google的每个搜索结果旁都会显示“加入黑名单”按钮,而在浏览某个网页时,你可以点击插件栏的uBlacklist按钮,将正在浏览的网站加入黑名单。加入黑名单的域名或子域名,将会被从搜索结果中剔除,同时在搜索界面显示“uBlacklist已经屏蔽了x个网址”,其中域名和子域名遵循Mozilla匹配模式(格式如://search.bilibili.com/
。Google有时会在搜索结果中包含B站搜索的网页,而如果我需要视频结果我会使用站内搜索,所以这里将它屏蔽掉)。
实际上,我也一直苦于搜索结果中的“程序员信息网””代码先锋网“之类网站,它们更像是纯粹的搬运(或者说,偷窃)各位博主的劳动成果。由于这种网站并不太多,简单的像上面这样域名屏蔽即可解决,大不了再屏蔽就是了。此外,华为云社区有时也会干这种不三不四的事情,搞不懂是为什么,反正一起被我屏蔽了。
但这些“小X知识网”实在太多了,有的域名都没注册直接拿IP地址就出来污染,靠域名根本屏蔽不完,怎么办?uBlacklist还支持标题屏蔽,更支持正则表达式,格式如title\your_regex\
。直接添加title\小.知识网\
和title\小.百科网\
,搜索结果马上就清净了。
想一劳永逸?在下面的V2EX原帖链接中,一些网友还提供了规则订阅链接,免于手动配置屏蔽,威力比较大,可能误伤。
或者你也可以尝试”Content Farm Terminator“插件,它能够一定程度上自动屏蔽这类内容农场网站。
参考:
请问在 google 搜索时,频繁遇到小 X 知识网等内容农场式结果,怎么办? – V2EX
亿点碎碎念
作为互联网汪洋大海的一个小透明网站,不知道我的文章有没有落入这类网站的魔爪之中。
我个人是反感这种做派的,但鉴于本站的文章默认遵守CC BY-SA 4.0协议(后续会在网站更多文章中有更明显的体现),只要注明来源、许可没问题那我也不好干涉,所以如果您碰巧发现疑似我的文章被盗而未标明出处,欢迎通过本站左上角公告中的邮箱联系我,或者直接在本文下方发送评论,我将尽量投诉此类网站,在此不胜感激。当然,懒得帮也没关系,还是感谢您能抽时间观看本文:)
不知道这些网站为什么要这么做,搞不懂盈利方式。
还学欧盟搞一个“本站使用cookie, 同意cookie”,但是拒绝有用嘛?
你还不是照常加了微软的网站分析 cookie?==
我还真没注意过这个事,找个时候把它整整,感谢提醒
好的,已经在Microsoft Clarity页面禁用了自动存储Cookie,现在Clarity应该不会再留下任何Cookie了。不过未来可能会加入Clarity和Cookie同意的联动。