书城管理李彦宏的百度世界
19774200000040

第40章 技术驰骋天下(1)

虽然,普通搜索用户感受不到百度的技术变化,WWW.BAIDU.COM似乎永远是那么简洁,甚至一成不变,但是,百度1000多人的技术团队却每天都在紧张工作,保证百度在中文搜索等领域里的技术一直领先。

百度搜索等主程序每隔一段时间就要进行一次大规模升级,每天都要进行一些小范围的技术改进。在这些技术研发的过程中,各种技术难题层出不穷,百度人已经习以为常,并且建立起了处理技术难题的成熟机制,一般性的技术难题都可以在总监层面解决掉。而对于一些重大技术难题,全公司最优秀的技术人员,则可以集中突破。

2005年1月31日,百度迎来5周岁生日,同时宣布收录中文网页突破6亿大关,成为全世界最大的中文网页库。据统计显示,目前中文网页共有8亿多,其中有2亿多的垃圾网页,而真正有价值的网页目前有6亿,中文互联网页5年增长120倍。

中国互联网信息中心的数据显示,2005年,中国的网民数量突破了1亿人,中国成为继美国之后的全球第二大互联网市场。

这一年,来自中国互联网企业的光芒异常耀眼——百度在纳斯达克上市,阿里巴巴收购雅虎中国的全部资产,海外风险投资基金抢滩中文博客……

百度的迅速成长、中文网页的高速增长,以及中国市场已经显现出来的巨大潜力,让远在美国硅谷的Google高层再也无法忽视了。之后,Google进军中文搜索市场的步伐明显加快。

与Google近距离战斗

2005年,Google以百万美元巨资买回了几年前被别人抢注的CN域名Google.com.cn和Google.cn,创下了CN域名史上交易的最高价,显示了Google进军中文搜索的决心。

其实,Google成立后的第二年就推出了中文搜索,但由于各种原因,Google一直在中文搜索市场徘徊不前。而位于中国的百度,则在中文搜索领域迅速崛起,2003年,百度超越了Google中文搜索的市场份额,到2005年的时候,百度已经牢固树立了中文搜索的“一哥”地位。

2005年7月19日,一条爆炸性新闻在互联网上传开:Google宣布该公司将在中国建立产品工程研究院,同时,微软互动服务部门副总裁李开复将加盟Google公司,出任全球副总裁及中国区总裁。

李开复具有在国际大公司担任要职、工作多年的经历,更重要的是,他是华人,了解中国文化,了解中文。

显然,Google不惜代价李开复挖过来,目的就是实现在Google在中国的本土化,改变Google多年来在中国发展缓慢的局面。

但是,面对在中文搜索领域绝对强势的百度,李开复显然要做打“持久战”的准备。

2005年7月25日,李开复以Google全球副总裁及中国区总裁的身份在北京面见媒体,他称自己目前考虑的正是如何吸引人才、培养人才、提高用户满意度,而对于Google在华市场开拓和盈利预期,则称根本不在目前的考虑范围内。

以Google全球副总裁及中国区总裁的身份看,李开复的职责绝非仅仅是上述两个方面,之所以上任后明确表示要在人才及提高用户满意度上下功夫,是因为李开复想表明自己并没有违反有关规定——就在Google宣布李开复加盟Google公司的同一天,微软向美国华盛顿州地方法院提起诉讼,指控Google和前微软全球副总裁李开复违反了竞业禁止协议。最终,美法院判决李开复可以正式到Google上任,但只允许他做一些跟人事、招聘方面有关的工作,不能做涉及技术层面的工作。

显然,身为全球一流的技术专家,不能做与技术有关的工作,这对李开复来说应该是比较痛苦的事情。不过,除了有法院判决的约束外,李开复主动提出要在人才与用户满意度上改进,还有更深层的原因。

应该说,从全球范围看,在技术开发、人才储备、资本等要素上,Google比百度的综合实力要强,但是,为什么Google在中文搜索领域却一路输给百度?

至少,在中国市场,Google在吸引人才、培养人才、提高用户满意度上显然不如百度,这恰恰是百度在中国市场将Google逼迫得节节败退的部分优势。因此,李开复试图从上述几个方面寻求突破,将Google在中国的内功切实打好,否则,Google在中国市场的盈利与持续发展都是空话。

Google正式进入中国,表明百度与Google开始了贴身肉搏。

什么是真正的本土化

李开复上任Google全球副总裁及中国区总裁后,履行的首个项目就是全面负责Google中国产品工程研究院的组建,此外,Google还同中国最大的IT应用服务运营商中企动力公司合作。

2006年10月,李开复亲自到浙江大学招聘应届生,他必须尽快为Google中国产品工程研究院招募到足够多的优秀人才。

巧合的是,不久以后,李彦宏也亲自去浙江大学进行了招聘,百度的招聘宣传策略显然非常具有针对性。百度在招聘现场摆放了几幅宣传画,每一副画下面都有一句宣传标语。

其中一幅图上面写着:“是投降还是比别人更强”。

全球搜索引擎技术6年前已经成熟,涌现出了大批搜索技术公司。起初,在中国与百度差不多的搜索引擎公司大约有五家公司,如天网、忧游、3721、21CN等等,但他们在遇到Google、Yahoo!等强大的竞争对手后,都先后消失了,或者被吞并,或者自取灭亡,或者转型、离开了搜索行业,到现在几乎已经不为人知了。只有百度,在与对手竞争博弈的过程中,慢慢成熟、成长起来,短短几年,把几大国际巨头在中文搜索市场的份额逼迫得越来越小。

百度的经验表明,在一个强大的竞争对手面前,选择投降还是立志做到比别人更强?这关系着公司的最终成败。

最初,百度的所有指标都比Google弱,市场份额也比Google差很多。百度为此进行技术攻关,一点点赶超,从2001年开始,百度的相关数据和指标一点一点改善,到了2004年,百度在技术指标上追平了Google,2005年以后,百度的指标超过了Google。面对“是投降还是比别人最强”的选择,百度人毫无犹豫地选择了后者,在竞争过程中积累、发现自己的优势,在竞争对手面前表现出强烈的信心和勇敢。

另一幅上写着:“是翻译还是……”

李彦宏后来直言不讳地承认:“这句话是针对Google的”。在他看来,百度的真正对手不是Google中国,而是那些在硅谷、在Google总部的斯坦福、加州理工、麻省理工最牛的博士和硕士。

李开复就任后曾经说过,未来要把Google在中国的产品做得能让中国人使用,要做汉化的Google。李彦宏显然对这种汉化的说法不以为然,他认为,李开复所说的汉化就是翻译,汉化和本土化是不一样的。

Google和Yahoo!早在2001年就开始做中文搜索了,此时百度还没有成立。当时做中文搜索的主要做法是把各种英文信息汉化,就像翻译一样。用户分别登陆Google.CN和Google.COM所看到的页面是不一样,Google的中文页面上的产品非常少,但美国页面的产品非常多。Google的汉化针对的不是中文搜索,而是Google网站上除了网页、新闻之外的其他产品。由于Google的后台管理全都是英文,一些普通网民很难使用,所以需要进行汉化,如GMail、G TOP、电子表格等。在李彦宏看来,这些没有太多的技术含量,只是编码的转换而已。

李彦宏认为,作出一个能用的搜索引擎很容易,但是做出一个好用的、用户天天都想用的搜索引擎就很难。搜索引擎的好坏在一些热门词汇上是很难表现出差异的。比如李宇春最热的时候,在百度、Google搜索,感觉结果都差不多,因为最热门的东西网上有很多内容,转载特别多、链接也特别多,容易抓取信息。搜索引擎好用与否,会在一些冷僻词汇的搜索结果上有更多体现,比如当用户搜一些比较偏僻的词汇,或者搜索自己的同学、高中初恋女友时,搜索引擎就体现出了比较大的差别。有些网站的搜索引擎抓不到网页,有的虽然索引上去了但是找不到相应的信息。

由此可见,Google要做的不仅仅是翻译或者是汉化,更重要的是真正做到本土化。

百度的小步快走

2006年2月7日,百度宣布任命技术副总裁刘建国为公司首席技术官(CTO)。担任百度CTO后,刘建国除了继续领导技术团队之外,还致力于增强百度产品市场方面的研究、开发和运营,进而推动百度产品的不断创新和用户体验的持续提高。

刘建国在软件工程、研究开发领域拥有超过15年的工作经验,有着出色的管理才能和丰富的管理经验。2000年1月加入百度后,于2000年8月被任命为百度技术副总裁,管理着快速壮大的工程师团队,担负研究开发任务,在中文搜索引擎的相关技术领域带来不断创新。

作为百度的第一位员工,刘建国见证了百度成长为国内最大的搜索引擎的全过程。李彦宏表示,“他领导创建的百度技术团队是中国高科技领域最优秀的技术团队,也是世界互联网领域最优秀的技术团队之一。他所具备的行业知识、技术专长以及卓越的领导才能都是国内首屈一指的。六年来,百度的技术团队历经风雨,在快速成长中建立了完善的流程,吸引了大批优秀的技术人才,培养了我们自己的骨干力量。从而奠定了百度中文搜索市场份额绝对第一的基础。”

说实话,在所有的技术层面,尤其是基础性研究领域,百度没有Google强,李彦宏承认,百度在技术上的革命性突破几乎没有。百度是靠日积月累,逐步发展起来的。具体的产品应用开发,每天都有很多小改进,这样的小改进,最终汇聚起了百度在搜索技术领域的技术门槛。而这个技术门槛之所以很难打破是因为需要常年的技术积累,这意味着,这种门槛,不是钱可以解决的,需要一大批人前赴后继,一点一滴地积攒。

百度的这种小步快走、逐步积累、点滴进步的技术策略,导致拥有雄厚自己实力和技术实力的Google很难发挥资源优势。Google一贯是依仗雄厚的资金优势,大规模投入,集团军作战,而百度的实践证明,在搜索技术的引用层面,根据用户需求进行常年的细微改进更为重要,这些不是依靠大规模投入、在短期内突击就所能解决的。

当然,用这样的细小改进与Google拉开一定的距离,并非是长久之计,假以时日,Google也有可能做到。要想与Google决战,百度必须在核心技术上有大的突破,在人才储备上有持续性。

百度从诞生的第一天起,就在跟全世界最强大的高科技公司进行面对面的竞争。这锻炼了百度的队伍,其实也给百度带来了很大压力。百度要跟他们比人才,比技术,比管理,比系统。尤其是网页检索领域的竞争是非常激烈的。2007年,百度继续保持了索引量上的优势,绝对索引量增加了50%,性能上也在稳步提高。

同时,百度也重金打造了稳定、高效、高标准的技术支持系统。2007年,百度大规模投入,分别建设了深圳、天津、东京、香港的IDC,在网络连接上也进入了千兆的时代。此外,百度还与英特尔、华为、思科等多家世界级高科技企业建立了联合实验室。

为了在技术研发上持续进步,缩小与世界一流技术的差距,李彦宏将他之前的老师兼老板挖了过来。

十年前邂逅,十年后合作

生于台湾威廉·张(William I.Chang)从哈佛大学数学学院毕业时,因次线性文本匹配算法上的突破性成果,获得了美国加州大学柏克利分院计算机专业博士学位。1991年毕业那年美国经济不景气,加上有着广泛的职业兴趣和个人爱好,威廉·张进入了纽约久负盛名的Cold Spring Harbor实验室,做计算生物学博士后,参与基因地图的绘制。

当时,实验室里的科学家进行了几个月实验,积累了大量数据,但却不知道这些数据到底是不是正确的。威廉·张把过去几个月的实验数据都打印出来贴在墙上,用颜色笔逐个划线进行数据对比分析,整整忙碌了一个晚上。第二天,威廉·张告诉那些科学家,他们实验得出的数据基本上是正确的,但有些系统性毛病,如果将这些毛病解决,实验就成功了,也就是说,这个实验的方向是正确的,只需要在细节上进行调整。这是那些科学家们最想听到的消息,接下去要做的就是如何进行系统性调整。威廉·张于是重新设计了实验流程,一年后实验圆满结束,威廉·张又承担了实验论文的写作任务。到这个时候,威廉·张成为了对整个实验过程最了解的人。

然而,真正让威廉·张成为一个行业领头者的,却是在互联网领域。