第一点:搜索引擎对内容的抓取处理索引的机制分析
步骤1:逐步搜索引擎会 派出蜘蛛对网络进行抓取将互联网四通八达的内容进行抓取返回到自身数据库里面
步骤2:对抓取回的网站进行处理降噪抽离来提取网站主体部分(前面信噪比
步骤3:对文本内容进行中文分词去除停止词等无意义内容搜索引擎。
步骤4:对页面进行分词处理搜索引擎保留的内容与数据库中已 有数据进行比较网站关键词排名优化搜索引擎保留的内容与数据库中已 有数据进行比较判断是否有重复内容剔除重复页面对剩余网页进行倒排索引等待用户检索
第二点:用户检索搜索引擎的工作流程
步骤1: 关键词文章将结果如何对关键字进行组合扩展关键字所以当用户进行搜索之后搜索引擎会判断进行搜索的用户地址位置历史检索等各方面为用户展现最需要的内容解析。
步骤 2:查找缓存中是否有该关键字的查询结果如果有结果搜索引擎为快速展现结果从而对现有数据进行处理然后呈献给用户原理。
步骤3:如果查询的关键字在缓存 中不存在那么就在索引库中的网页进行调取排名呈现然后将新的内容放到与关键字对应的缓存中优化。
步骤4:网页排名的考虑因素主要有用户的搜索词
综上所述:搜索引擎的工作原理也就是刚才讲的搜索引擎的工作原理大概就是 进行抓取处理分词去重索引内容相关性链接分析用户体验等各种因素综合考虑再结合用户需要进行排名展示工作。