正文

3.1 佩奇位阶(2)

搜主义:Google持续成长的秘密 作者:张远昌


由于远比以前的任何搜索引擎好用得多,事实上Google改变了许多人使用网络的方式。几乎一夜之间,它让网络变得实用许多,尤其是对“非专家”使用者而言,其中许多人现在把Google当作网际网络的前门。企图急起直追的微软公司CEO波尔默(Steven A. Ballmer)不得不承认:“Google证明了一个事实:更好的捕鼠器果然重要。”

1998年诞生的Google,当然不是第一个搜索引擎。当时的其他搜索引擎,能够扫描或者“抓取”网络的一大部分信息、建立索引,然后找出符合特定字词的网页。

在当时,创立另一家网络搜索公司无疑引起了硅谷许多IT分析人士的嘲笑,因为许多人都认为网络搜索已经是一条死胡同。市场上已经有AltaVista、网景(Netscape),以及美国在线(AOL)的“网络爬虫”(WebCrawler),更别提Lycos、雅虎(Yahoo!)和其他许多网站提供的搜索服务。

网络搜索引擎多如过江之鲫,可惜它们的搜索功能都是雷同的。它们在呈现搜索结果网页时,有时多达数十万条的条目,叫人从何看起?Google相信自己能够提供不同于它们的搜索。

Google从一开始,追求的就是一个完美的搜索引擎。佩奇和布林认为,所谓完美的搜索引擎,就是能跟你进行智能对话,能够丝毫不差地了解你的意思,同时丝毫不差地提供给你想要的东西。

这两位年轻人的成就,在于拒绝接受技术方面的限制,埋头持续努力创新,发展出佩奇位阶(Page Rank,也翻译为网页级别)技术。该运算法则是Google成功的核心,使其区别于以前所有的搜索引擎并赋予其从浩淼网络中为用户找出最有用网页的神奇能力。它决定哪些网页可能有你最想要的信息,并在搜索结果网页上根据相关性高低整理排序,从而改变了网络搜索的方式。

Google的搜索结果排列是依据其“网页级别”(Page Rank)技术,即考察该页面在网上被链接的频率和重要性来排列的,互联网上指向这一页面的重要网站越多,该页面的位次也就越高。作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其他网页的“重要性”。

重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号