正文

PageRank——让谷歌腾飞的技术(1)

改变未来的九大算法 作者:(美)约翰·麦考密克


《星际迷航》(Star Trek)中的计算机并不特别让人感兴趣。他们向计算机提问题,计算机还要想一会儿。我觉得我们能做得更好。

——拉里·佩奇(谷歌联合创始人)

从建筑学的角度来说,车库基本上是个简陋的地方。但在硅谷,车库有一种特殊的创业含义:许多伟大的硅谷技术公司在此诞生或至少从车库中孵化而来。这一趋势并非从20世纪90年代的互联网泡沫开始。在互联网泡沫出现的50多年前,也就是1939年,当世界经济仍未从大萧条的影响中走出来时,惠普(Hewlett-Packard)就在加利福尼亚州帕洛阿尔托(Palo Alto)戴夫·休利特(Dave Hewlett)的车库中逐渐成形了。几十年之后,史蒂夫·乔布斯(Steve Jobs)和史蒂夫·沃兹尼亚克(Steve Wozniak)于1976年在加利福尼亚州洛斯拉图斯乔布斯的车库中创业,之后创建了今天传奇的苹果计算机公司。(尽管传说苹果公司创办于车库,乔布斯和沃兹尼亚克一开始其实是从一间卧室开始的。空间很快就不够用了,于是他们转移到了车库。)不过,和惠普和苹果的成功故事相比,一个名为谷歌的搜索引擎的创办过程更令人惊叹。谷歌从加利福尼亚州门洛帕克市的一间车库开始,并于1998年9月注册成立公司。

那时,谷歌事实上已经运营自己的搜索引擎一年多了——最开始是在斯坦福大学的服务器上,谷歌的两位联合创始人都是斯坦福博士生。直到斯坦福大学再也不能承受这一日益受欢迎的服务所需要的带宽,拉里·佩奇和谢尔盖·布林才把公司转移到了如今著名的门洛帕克车库。他们肯定做了些正确的事,因为在他们正式成立公司3个月后,美国《个人计算机杂志》(PC Magazine)就宣布谷歌是1998年美国排名前一百的网站之一。

这也是我们的故事真正开始的地方:在当年《个人计算机杂志》的评论中,谷歌的精英管理层因为谷歌“以超乎寻常的技巧返回相关度极高的结果”而获奖。你也许还记得上一章提到过,第一个商业搜索引擎于4年前的1994年发布。还在车库里的谷歌怎么能弥补4年的巨大差距,在搜索质量上超越已经很受欢迎的Lycos和AltaVista呢?这一问题的答案可不简单。但最重要的因素之一——尤其是在网络搜索早期——就是谷歌用来对其搜索结果进行排名的创新算法:一个被称为PageRank的著名算法。

“PageRank”是个双关词:它既是一种对网页排名的算法,也是其主要发明者拉里·佩奇的排名算法。佩奇和布林在1998年的一篇学术会议论文《解析大规模超文本网络搜索引擎》(the Anatomy of a Large-Scale Hypertextual Web Search Engine)中发表了这一算法。正如论文标题所暗示的,这篇论文的内容不止是描述PageRank。事实上,这是对1998年存在的谷歌系统的完整描述。但藏在这一系统技术细节中的,是对也许是21世纪出现的第一个算法瑰宝的描述:PageRank算法。在本章,我们将探索这一算法如何以及为什么能在草垛中寻针,并持续为搜索查询提供最相关的结果——也是排名最靠前的命中。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号