您现在的位置是:博客首页 > 网站开发 > SEO优化 > SEO优化

黑帽seo技术之大站快照劫持与推广

brooks2020-06-03个人博客人已围观

简介做为SEO行业从事者,少不了经常被人咨询灰色词SEO波菜关键词的黑帽优化方法,由于自己只擅长白帽SEO正规手法,对黑帽SEO一无疑所知,转载本文来揭密黑帽灰产SEO的玩法套路。 研究SEO应有的

做为SEO行业从事者,少不了经常被人咨询灰色词SEO波菜关键词的黑帽优化方法,由于自己只擅长白帽SEO正规手法,对黑帽SEO一无疑所知,转载本文来揭密黑帽灰产SEO的玩法套路。
研究SEO应有的态度,不是无脑的相互模仿,而已追根逆源,找出背后的原理。好了开始正文分享(如有侵权联系删之)

先来上个图:

 

相信大家对于上图都比较熟悉,基本上也都见到过。但是很多人都好奇这玩意是怎么做到的?有没有很高深的技术呢?

 

正好今天在浏览简书的时候有看到,索性就花了半小时研究了一下,发现其实原理都很简单,用到的都是seo的基础知识哈。

 

上面截图出来的一共有三种不同的操作手法,这里会一一讲解到。

首先看排名第一的,直接点进去看看。发现这个就是简单的构造搜索链接来达到收录推广的目的。

 

但是这玩意,不能说你构造出来就行了,还得让百度蜘蛛发现和收录吧?咋办呢?发外链呗,到各大平台去留言,通过留言来发外链就好了。就比如下图的,就是在简书上留言:

 

奥力给有木有,虽然简书对这些留言链接进行了nofollow,但是不影响百度的链接发现的。由此也可以得出一个结论,nofollow对于百度的抓取似乎并没有什么太大的影响?那么nofollow影响的是啥?

 

 

 

这个标签的意义是告诉搜索引擎,这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。

 

 

 

所以,大家在给网站加nofollow的时候,可要考虑清楚你要加它的目的是干什么?不能瞎搞哈。

排名第二的就有点意思了,我们来看看:

 

 

我们发现,点击进去页面是正常的。首先有了先例之后,我就开始怀疑会不会是在链接上做了手脚呢?比如有两套不同的链接,但是可以访问同样的页面。有了想法,就开始去验证,回到首页点击其它的新闻看看正常给到的新闻页面是什么样的。

 

发现了么,URL的结构不一样,当然,这个是最新的。而之前那个是2016年的,而且没有HTTPS。那就是说可能URL经过改版了。而且原来的那套URL也还能访问。于是动手改了一下,发现真的可以。

 

不过这个并不能验证为啥title被改掉了,因为目前这个手法还是比较流行的。其它的大站也都有“中招”。看起来像是快照劫持,但是快照劫持要入侵服务器,修改文件响应,按道理来说,搜狐、新浪这些大站点应该不至于那么容易被hack,而且量又不大。看看下图的:

 

 

都是比较出名的大站,而且都是标题改了而已。目前,初步怀疑是外链锚文本+301跳转导致的,具体不是很清楚,有知道的大兄弟可以私我说说哈。

 

来看看第三种方式,伪造关键词tag页面。

 

都是网易的标签页,打开看看:

 

404来的,看到一长串的数字。老头疼的,本着学习的目的,继续深究一下看看能不能找出点啥东西出来。先去瞅瞅正常的tag页面是啥样的,随便找个子栏目的列表页看看:

 

这些就是关键词,鼠标移上去就会在左下角看到他们的链接。这里整理贴出来给大家看看:


# 刘涛
http://ent.163.com/keywords/5/1/52186d9b/1.html
# 鬓边不是海棠红
http://ent.163.com/keywords/9/1/9b138fb94e0d662f6d7768e07ea2/1.html
# 清平乐
https://ent.163.com/keywords/6/0/6e055e734e50/1.html
# 塞上风云记
https://ent.163.com/keywords/5/5/585e4e0a98ce4e918bb0/1.html

可以看到,链接的pattern是这样的:


https://ent.163.com/keywords/{加密ID[1]}/{加密ID[3]}/{加密ID}/1.html

可以总结出网易的tag链接组成特征:

1. keywords后面跟着的两个数字目录就是关键词加密后的,第一和第三个字符

2. 关键词加密后的长度跟关键词的字数成正比

 

接下来就是要研究它的加密算法了,一般的,看加密算法先了解字符串的长度和特征,这里就不说了。看到加密后的都是小写的数字加字母,而且字母只出现了a/b/c/d/e/f这几个,再结合加密后的长度验证,得出这个就是一个简单的16进制加密:

 

可以看到,这个一个汉字对应得出4个数字的加密,那这个就是16进制的加密了,16进制是占用4个字节的,所以刚刚好。但是这些汉字是如何转换成数字的呢?如果对编码熟悉的童鞋就会知道,一个汉字得到4个数字,不就是unicode编码的16进制表达么。只要轻松转换一下就好了。这里补充一下,由于字母转换成unicode编码的16进制之后,得到的是两位数,因此需要对它进行等宽对齐到4位。

有了想法,那么就是校验的过程了,代码搞起来:

 

校验成功之后就是封装成函数了,好方便调用:


def crypto_tag(tag_name):
    if not isinstance(tag_name, str):
        return ''
    cpt_str = ''
    for t in tag_name:
         cpt_str += f'{ord(t):04x}'
    return cpt_str

 

就是这么简单,然后就是批量生成关键词的链接,拿去发外链就好了:

 

 

真特么牛掰,不得不说,做黑帽的技术就是牛,不佩服不行。

 

今天的分享就到这里啦。

那么问题来了,为啥这些构造出来的404页面也能够被收录呢?

很赞哦! ()

站点信息

  • 建站时间:2019-05-13
  • 网站程序:魔豆CMS7.5
  • 博客名称:程序员之路
  • 文章统计:117 篇
  • 源码统计:6 篇
  • 访问统计
  • 微信公众号:扫描二维码,关注我们
  • 微信公众号