其实另一方面毫不客气的说这些竞争者不过是一群连基础概念都不懂的人罢了。没错SEO这些竞争者不过是一群连基础概念都不懂的人罢了。没错可悲的是哪怕这个行业的中流砥柱也大多是连基础概念都缺乏的。因此本文我必须要从基础概念讲起。
1.一段话概括搜索网页的排序规则:在极短的时间内让尽高比例的用户找到符合他需求的内容从这一条终极原则出发可以通过演绎推理直接推论出数不胜数的可能的操作点。此处为了方便理解让我假设个情境。用户搜索「薛之谦」这个词互联网上总共就三个相关网页。同时假设百度总共只展示3条搜索网页那么这三个网页同时展现了分别的点击率如下:薛之谦音乐aCTR:50%薛之谦音乐bCTR:30%薛之谦音乐CTR:20%假设总共只展示1条搜索网页呢?上面三个网页之中无疑会展现1号网页。但如果总共展现2条搜索网页?有意思的事情发生了显而易见应该展现的是1、3号网页这样才能满足不同用户的不同需求达到整体点击率的最大化。
2.很多词其背后都具有差异极大的细分需求。例如「薛之谦」可以有「薛之谦歌手」、「薛之谦音乐」、「薛之谦段子」这些细分需求。搜索结果首页的10条搜索结果里面呈现的细分需求越全面越好这应该已经非常容易想领悟到。但是百度是怎么确定每个词具体的细分需求是什么呢?这里涉及到个非关键但知道了会容易帮助想明白问题的知识点其实也属于搜索引擎领域的常识——大多数用户在看了一页搜索结果没有找到想要的内容的时候不会选择翻到下一页而是改为搜索另一个(往往更具体的)词。所以对于百度而言很简单只要看搜索「薛之谦」之后有多少比例的用户会转为搜索「薛之谦音乐」就知道这个细分需求的程度有多大。化。
3.独自了解「后继搜索词」这一个概念还无法把「SEO」这种非常热词的排名做上去。下面需要介绍的一个概念是粗排和精排。我仍然是通过「逻辑」来想明白它的。但是就算没有深入思考只要研读几本搜索引擎原理书或者自己做个简单的文本检索都一定会知道粗排和细排的问题。但是即使我一向认为搜索引擎原理书籍是入门头一个礼拜就该去看的却鲜少有人真正去安稳学习这种基础中的基础。让我们具体来看这事儿吧:假如百度在搜索结果首页想展示10个后继搜索词的对应网页那么技术上有以下几种策略:直接分别搜索10个后继词的结果然后拼到主词首页上搜索到主词对应的假如1000万个搜索结果然后在全部1000万个网页里面搜10次搜索到主词对应的假如1000万个搜索结果然后在比如其中得分最高的前1000个里面搜索10次显然尽管看上去搜索质量上面1>2>3但计算的时间成本上1和2都远远大于3。到这里为止百度实际采用的哪个方案都可能如果谁研究Google规则发现它用的是1或者2毫不奇怪。继续动用逻辑:如果主词的比如1000万的搜索结果里面必有后继词;比如「薛之谦段子」这种包含了「薛之谦」主词的。但顺带它们并不绝对需要包含。那么在这情况下上述策略1和策略2的最终展示结果是一样的;总有些特殊情况比如缓存策略等等所以需要多搜一些词来确定。反过来只要直接搜后继词排名第一的结果有较高的比例没有出现在主词的首页就能说明百度采用的策略3。实际百度用的就是策略3。SEO这东西吧一个好的地方就在于排名结果都是摆在那儿的东西。要验证猜想多搜些个词看看就行了成本微乎其微花上几个小时都算磨叽。什么实践出真知一定要试试才敢确定结果测试一下动辄几周几月。那些不分情况总是固执于「实践」的人脑子真的是不好使。
4.虽然逻辑上说清楚了有个对照的词会更容易记住这样的概念一般在搜索引擎领域被认为是粗排和精排。粗排是搜索引擎从数以亿计的互联网页面去找寻到主词对照的topn个页面。精排是搜索引擎从topn个页面里面再进一步的计算更复杂的规则其中就涉及到了后续搜索需求这个问题(但远不止是)。粗排精排的概念我小范围公开分享过。后来有个朋友找认识的百度研发人员直接去问对方回复是百度的粗排这轮取的页面数量就是搜索结果展示的最大数量760而且粗排的排序规则只有BM25。假设读者不知道BM25是什么搜索引擎原理基础就属于乱七八糟了我的个人建议从《走进搜索引擎》看起。粗排规则只有BM25肯定是扯只用BM25的话随便在页面上重复几次关键词就过粗排这轮了极其不合理而且也和我收集的大量案例不符合。但粗排取的页面数量是760根据我观察下来的粗略分析有可能确实是这样的。
5.写了诸多了但我究竟怎么把「seo」这个词的排名做上去的呢?介绍下当初网站情况吧之前我运作了一个小型的SEO行业论坛每日活跃发帖用户十几二十人。整个网站几百个页面很少的友情链接(后来的也是排名上去后随便就能和人换到链接就保险起见加了些)更没其它外链。开始动手做排名之后呢?因为排名做上去的流程实在太轻松了所以不把理论上说全面一定被当成胡说八道:把网站首页title进行修改加了个「SEO学堂」买了两条友情链接共计50元没了。真的没了。
6.可能有读者会想这般简约有问题吧?假设潜意识上有这样的想法是应有的。毕竟错误的归因是大部分人均会犯的错误。我看过蛮多次有谁作了什么SEO操作过了几个月了都忘了回来发现流量涨了就说自己做对事了瞎对应。归因至少在SEO这件事上正确的归因至少要具备两个条件:1)合理的理论解释2)合理的时间点在我的网站「SEO学堂」这个后续词已经排名前列而「SEO」在前760名都看不到的时候我知道最后一步只差进「SEO」这个词的粗排。而且根据观察百度的粗排规则主要是类似于PageRank的比较基础的权重这也是个稍稍多搜些词就能发现的问题。对此我买了两条链接随后一周左右的时间百度排名更新后排到了首页。
7.有读者肯定已经发现的奇怪的还没解释的问题为甚之后的词是「SEO学堂」这么诡异的词?答案是自己都不知道谁刷的长期在那。我那时早没百度司南的数据权限了但只知道长期有个title里面包含「SEO学堂」也大致没命中其它之后的词的页面排在首页就能直接确定「SEO学堂」是个有效的的之后的词。借了个巧。后来排名稳定了一段时间我也把自己网站上的论坛运作的还不差想想网站权重应该不低了同时觉得「SEO学堂」这个诡异的词加在title不太合适就删去了它改为了「SEO教程」排名仍是稳定了许久。如果不是我这种实在没内容没链接的小破论坛只要稍微好点的网站当时都完全是可以直接做「SEO教程」或其它类似的之后的词排名的。等等!「SEO学堂」改成「SEO教程」之后我网站排名没掉是因为什么?真的是我前面说的理论那样吗?还是本来就可以排在前面了一切只是巧合?还是前面提到的读者在阅读过程中有疑虑是应该的没有疑虑才是错误的汲取知识的态度。但是回到之后的词的理论上哪怕可能没做过、没观察过还是可以仅仅经由逻辑想明白。将之后的搜索词结合起来粗排精排的概念可以得出猜想:对于存在之后的词效应的主词其对应搜索结果页面的排名只有两种状态:在第一页、在后面任意位置。并不会出现第一页排名下降后顺位挤到第二页的情况。实情会稍微复杂些比如开放平台占位、点击调权等但整体还是前面所述。当初我的网站经由「SEO学堂」排上去的时候原来那个「SEO学堂」对应的其它网站排名同时掉到了很后面;同样「SEO教程」上去的时候原来的「SEO教程」对应网站排名也同时掉到了很后面。理论、时间点都完美符合因此是正确的归因。后来一方面是因为焦大他也自己琢磨出了个大概和我竞争排名;其次我那时候经营做外包业务量大实在顾不过来。最终「SEO」这词的排名在百度首页保持了一年多以后掉了。另外时至今日读者已经没什么必要再去分析「SEO」这个词的排名了百度首页目前被各种刷点击的网站全面覆盖倒也是投机取巧。违禁词数量:0