“后裔算法”的作用:对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权,同时确保新闻网站之间正常的转载行为不受影响。
互联网的快速发展离不开原创和稀缺的优质资源,而通过我们近期的数据分析和用户反馈发现,部分网站采取疯狂而低劣的采集手段,短时间内拼凑出大量低质量采集网页。这种行为使得互联网上内容拼接、偷换标题、过多垃圾广告等低质量的网页逐渐泛滥,不仅严重影响了正常用户的浏览体验,同时也导致优质原创内容无法优先展现,对用心构建原创和精品内容的网站也造成了一定的伤害。
“后羿算法”上线后,对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量。
文章评论