|
回归黑帽SEO科普系列。
你去源码站搜索,发现一堆“pan-XX”的代码,其中大部分是“pan-inner pages and pan-directories”。这是什么?
看着各种程序的介绍,看起来很牛逼。但在小白看来,我还是不明白是什么。
对于一个普通的网站,一个 URL 对应一个唯一的关键字。比如我建一个网站的时候,我设置了两种url格式,一个列表页和一个详情页:
{cid}/
{cid}/{pid}.html
对于这个url结构,至少要创建两个数据表:
一种是cid--cname,里面存储了“category id和category name”的映射关系
一个是pid-cid,里面存储的是“一篇文章和对应的分类”的映射关系
cid是分类的id,pid是文章的id,每个pid对应一个唯一的title。哪个pid属于哪个cid的映射关系是硬编码在数据表中的。
只要不改变这个映射关系,每个pid详情页对应的title就会一直保持不变。
pan-inner 页面没有这种映射关系。pid变量,可以在浏览器中编写,可以正常访问,标题一般是随机匹配的。
这里有几个栗子:
1)url不变,每次刷新时模板和标题都变。template和title、pid之间没有映射关系,都是随机匹配的。
2)但是这个每次都变,对搜索引擎不友好。加上缓存,在一段时间内,使模板绑定到标题和 pid
例如缓存设置为86400秒,则url不变,N次刷新后模板和标题不变。
3)一些替代的url后缀是不可访问的,例如.txt、.pdf、.xlxs.....
同理,通过新建url路由实现正常访问
4) 任意 url 随机匹配关键字
同样,列表页的cid不映射关键字,url中的cid也可以随便输入,也可以正常访问。
简而言之,“潘XX”就是随便输入url,就可以正常访问了。页面上出现的链接是程序随机生成的,随机的意思是无限的,baiduspider可以找到无限的不被爬取的url,可能会带来源源不断的爬取。
至于如何随机化,根据程序的设置泛目录是什么,可以在一个“范围”内随机,比如url必须符合一定的格式,或者随机id必须在一定的列表中才能访问等.
有时卖节目也会换个名词,叫“XX复制”,比如内页复制,意思差不多。
近日泛目录是什么,小白看了一些节目的介绍,表示很兴奋。事实上,没有必要。在SEO领域,在大多数情况下,程序是次要的。问题,但没有解决。
在功能实现方面,并不难。基本上,工作一两年的PHP,只要告诉他逻辑,就能实现类似的程序。
不说了,我们去开会吧。
如果有什么想看的,请留言。最近疫情的影响,造成的事情少了很多,可以多写点。
豪侠泛目录站群程序,专业泛目录,站群,二级目录,泛站群程序! |
|