什么是搜索引擎?
搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。
随着Yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威Yahoo!为例,从1995年3月由美籍华裔杨致远等人创办Yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。
然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。
爬行类搜索引擎是如何工作的?
这类搜索引擎会爬行检索网站,提取信息建立网页数据库。搜索引擎的自动爬行网站网页功能分两种,一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛(Spider)”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动检索网页,提取网站的信息和网址加入自己的数据库。
另一种搜索引擎需要您主动提交,它在一定时间内(2天到数月不等)定期向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库。
当访问者键入关键词查找时,搜索引擎会在数据库中进行搜索,找到与用户要求内容相符的网站,根据自己的排名算法,如网页中关键词的匹配程度,出现的位置/频次,链接质量等,计算出各网页的相关度及排名等级,按顺序查询结果返回给用户。
恶意关键字(Keywords Spamming)
这里不是指垃圾邮件(Email Spamming), 如果在您的网页内容上或在META标记中多次重复堆放某个关键字,这就叫做恶意关键字(Keywords Spamming). 比如:Atlanta hotels, Atlanta restaurants, Atlanta movies, Atlanta parks, Atlanta motels, Atlanta recreation, Atlanta gabmling, Atlanta ...,搜索引擎会认为是恶意关键字,降低排名或将该网站删除。准确的写法为:Atlanta hotels, restaurants, atlanta movies, parks, motels, recreation, gambling ...。
搜索引擎机器人(robots)
机器人(robots)事实上是一个精心设计的网站爬行程序,依照网站的连接从一个网站游历到另一个网站。根据这种自动化程序基于预先设计好的网站排名标准及算法,对网站进行评估排名。虽然每个搜索引擎各有各的标准及算法,然而他们对搜索结果判定网站排名上也具有很多相似的地方。
一个搜索引擎机器人会先爬行一个网站,检索在它看来是重要的页面部件,这些检索的数据随后被分析,并赋予指定关键字在搜索结果中的排名。每个搜索引擎算法被设计成足以判断相应关键字和相关页面的相关程度。
搜索引擎分类目录(Directories)
搜索引擎分类目录是由人工预审后被编入的网站列表。较为主要的搜索引擎分类目录有 Yahoo, LookSmart, Open Source Directory 等,您付款后也未必真能被收录至它们的分类目录中。分类目录会因为您网站导航不明确、网站设计不佳、死链接、网站是否正常运转、文法错误、文字不流畅、没有联系电话、没有商业地址、多次重复提交某目录的原因拒绝您的网站收录。在提交网站前反复审视您的网站,确保网站在正常工作后方可提交。事实上,在您没有做好充分准备前提交您的网站对搜索引擎目录收录是非常不明智的。就算您进入了搜索引擎的目录中,对您网站的排名也会有很大的影响。
搜索引擎会基于很多标准,如关键字的相关性、出现的频率等,来决定您网站的排名,它还将查看您网站的标题及描述和网站所在目录的相关性来决定网站排名。在某些情况下,外部连接的数量及质量也会在排名中体现出来。有些分类目录也会跟踪访问者点击搜索结果中链接后停留在网站上的时间来作为衡量网站排名的一个因素。
有一点必须注意,分类目录的编辑人员有会改变您实现定义好的网站标题及描述。
什么叫关键字密度(Keyword Density)
关键字密度是指在一个页面中,关键字(keyword)或关键字段(keyphrase)占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到关键的作用。为自然提高在搜索引擎中的排名位置,您网站中页面的关键字密度不能过高,也不要过低,一般在 1% 到 7% 较为合适。如果要达到 1% 的比例,那么您在平均 100 个文字中最好包含 1 个关键字或关键字段,如果在 1000 个文字中仅仅只包含 1 个关键字或关键字段,那么关键字密度就被稀释了。记住,您千万别把所有的关键字或关键字段堆积在一起,要不搜索引擎将人为是一种恶意行为(Spam), 直接降低您网站的排名位置。
什么叫坏链接(Bad Link)
在很多网站都可以看到各种和别的外部网站的链接,其实搜索引擎就是一个庞大的链接集合。这种链接成为外部链接(Link Popularity),高质量的外部链接在搜索引擎的排名算法中占据一席之地。然而要跟踪这些链接是否正常也非容易。您要慎重选择和您网站交换链接的网站。
Google是率先将这种外部链接列入排名算法中的。如果过多地和毫不相干的网站做外部链接,非单不会提高排名,反而会受到 Google 的惩罚。尤其是一味地和外界网站进行链接,而没有高质量的外部网站和自己链接。
您的网站要和外部网站做连接,一定要注意,这个外部网站是没有被处罚的。Google 有一个独创性的衡量网页信誉评估工具条,称之为 PageRank. 主要依据是该网页被其他网页链接的次数,级别越高表示该网页越可信。该工具条可以在 http://toolbar.google.com 上下载安装。
什么叫隐藏文本(Hidden Text)
几乎所有的搜索引擎都利用网站页面上的文字作为搜索结果排名的重要因素。也就是说包含关键字的网站页面在搜索结果中将有更大的机会获得较高的排名。许多webmaster都意识到了这一点,他们出于网站美观或者是否流畅,将大量包含关键字的文本颜色设置成和网页背景相同的颜色,访问者是看不到的,而搜索引擎的 Spider 可以看到,于是获得较高的排名。
在这里我们想告诉你这种做法有一定的效果,但很危险,随着搜索引擎的智能化程度的提高,这样的网站将受到惩罚,甚至被驱逐出搜索引擎。
我们不主张采用这样的作弊行为来提高排名。
什么叫 DoorPage
有时侯有人会建议 Webmaster 提交一个叫做“bridge page”或者叫做“Doorway page”到搜索引擎中去,以换取较高的访问量。Doorway page 实际上是为某些关键字特别制作的页面,有时也叫“portal page”、“jump page”、“entry page” 或其他名字。通过 Doorway page 再指向真正的网站。他很容易被鉴别是专门为搜索引擎设计的,而不是为访问者设计的。大多数搜索引擎不支持该方式,尽量少用。
什么是博客?怎么解释
水星领航员PSP动漫壁纸