做人做事,凡是都要追根究底,这样才能找到事实的真相。

搜索引擎索引并处理网页的原理

上一篇 / 下一篇  2010-07-27 10:04:31 / 精华(3) / 置顶(1)


  一般搜索引擎会由专门的分析索引系统程序对收集回来的网页进行分析,然后并提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),在搜索引擎提取到网页的基本信息之后,根据一定的相关度算法进行大量复杂计算,针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。本文由赵刚首发网站推广的博客,如果转载请保留版权!

  其中,最重要的就是提取关键词,建立索引文件。其他的操作还包括去除重复网页、分析超链接、计算网页的重要度等等。

  类似与上边的这一系列的进程,我们做网站推广和网站优化的是看不到的,但是却可以明显的感觉的到。这也就是我们做网站优化的切入点。毕竟赵刚觉得这些最基本的东西也是搜索引擎最核心最经典的,他们是不会有大的改变的,即便是有也是一些算法的改进和完善。

  只有当你了解了搜索引擎的这些基本原理之后,你所做的优化工作就会轻松很多,更不会迷茫!由于时间关系,赵刚就先简单介绍到这,下一篇文章会给大家分享搜索引擎的排序并提供检索服务的功能!

解析:搜 索 引 擎是如何抓取网页的?

站内搜索:

TAG: 搜索引擎 网页解析

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

我的栏目

日历

« 2017-10-18  
1234567
891011121314
15161718192021
22232425262728
293031    

数据统计

  • 访问量: 73078
  • 日志数: 422
  • 建立时间: 2009-03-03
  • 更新时间: 2011-10-27

RSS订阅

Open Toolbar