AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
32838 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

148 | 曾经辉煌的雅虎研究院

雅虎是最早成功的互联网公司之一,也是最早意识到需要把基础研究,特别是机器学习以及人工智能研究,应用到实际产品中的公司。雅虎从很早就开始招聘和培养研究型人才,雅虎研究院就是在这个过程中应运而生的。
今天我就来说一说雅虎研究院的历史,以及过去十多年间取得的成就,聊一聊如何通过引进高级人才,迅速构建起一支世界级的研发团队。当然,也会聊一聊研究院的衰落。高级研发机构对于企业而言往往是锦上添花的事情,在整个公司产品和视野都欠缺的情况下,也往往避免不了最后衰败的结局。

雅虎研究院的创立

雅虎研究院的故事要从一个叫乌萨马·菲亚德(Usama Fayyad)的人说起。乌萨马出生在北非突尼斯的迦太基(Carthage),早年在突尼斯以及其他地中海沿岸国家度过,包括中东、非洲以及南欧的一些国家。高中时期在约旦的安曼生活,后来在美国密歇根大学度过了他的本科(1984 年)、硕士(1986 年)以及博士(1991 年)生涯。毕业之后,乌萨马来到了美国加州南部隶属于美国国家航空航天局(NASA)的喷气推进实验室(Jet Propulsion Laboratory)工作,一直到 1996 年。之后加入微软研究院,从事数据挖掘的研究工作。
早在 1994 年,乌萨马就和拉马萨米(Ramasamy Uthurusamy)一起组织了最后一届 KDD 研讨班,然后在 1995 年,他们把这个研讨班升级成了会议,并在加拿大蒙特利尔举办了第一届 KDD 大会(First International Conference on Knowledge Discovery in Data)。从此,KDD 大会成了数据挖掘、数据科学以及应用机器学习的顶级会议。
1996 年,乌萨马又创办了一本叫《数据挖掘和知识发现》(Data Mining and Knowledge Discovery)的学术期刊,并亲自担任主编。这本期刊也渐渐成了数据挖掘领域主要的学术期刊之一。乌萨马本人可以说在 20 世纪 90 年代中期,就已经开始成为数据挖掘领域重要的领军人物。
进入 21 世纪,乌萨马先是在 2000 年创立了一家叫 Audience Science 的数据挖掘公司并担任 CEO,然后又在 2003 年创立了一家叫 DMX Group 的数据挖掘咨询公司,后者于 2004 年被雅虎收购。不久后,他成为雅虎的执行副总裁以及首席数据官(Chief Data Officer),这也是互联网历史上的第一位首席数据官。
因为雅虎在搜索以及广告业务上的扩展,乌萨马意识到应该成立一个类似于微软研究院,但更偏向于互联网业务的研究组织,这个想法得到了公司 CEO 杨致远的支持。乌萨马当时的首要任务是为研究院物色一位院长。
经过一段时间的寻找,他成功邀请到普拉巴卡·拉加万(Prabhakar Raghavan)来担纲。今天回头来看,普拉巴卡无疑成功地引领了雅虎研究院,并让其一度成为人人向往的互联网研究机构。当然,这跟普拉巴卡本人的经历也密切相关。
首先,他本人就是知名的学者,参与撰写的经典教科书《随机算法》(Randomized Algorithms)和《信息检索导论》(Introduction to Information Retrieval)在学术界享有盛誉。他还是 ACM、IEEE 的院士,也是美国工程院院士,这为他招纳学术界权威人士和博士生提供了便捷。加入雅虎之前,他已经在 IBM 研究院以及 Verity 任职多年,IBM 的从业经历更是让他对企业文化和工业界的研究机构有了很深的了解。
2005 年 7 月,雅虎研究院正式成立,普拉巴卡担任研究院负责人,向乌萨马汇报。2008 年,雅虎研究院与之前就在搜索与广告事业部存在的应用科学部门合并。在卡罗尔·巴茨(Carol Bartz)任职 CEO 期间,普拉巴卡直接给她汇报,并且普拉巴卡还曾担任首席战略官。

雅虎研究院的蓬勃发展和辉煌

雅虎研究院组建之后,首要任务当然就是吸引工业界和学术界的知名学者,从而能够组建一个有效的团队。普拉巴卡利用他个人和乌萨马的声望,很快就做到了这点。
比如,之前和普拉巴卡在 IBM 共事的安德鲁·汤姆金斯(Andrew Tomkins)加入团队,担任负责搜索的首席科学家以及搜索方面的副总裁(安德鲁后于 2009 年之后加入谷歌担任工程总监)。 再比如,曾和普拉巴卡在 IBM 共事的安德烈·布罗德(Andrei Broder)2005 年加入团队,担任负责计算广告方面的副总裁。
安德烈本人大有名头。他在斯坦福大学攻读博士期间师从图灵奖得主高德纳(Donald Knuth),然后在曾经名噪一时的第一代搜索引擎公司 AltaVista 担任首席科学家,之后加入位于纽约的 IBM 研究院组建企业级搜索平台。和普拉巴卡一样,安德烈也是 ACM 和 IEEE 的双料院士。2012 年安德烈加入谷歌,担任杰出科学家 (Distinguished Scientist)。
我们这里简单列举一些曾经在雅虎研究院工作过的知名学者,我们便可一览其盛况:
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(10)

  • 最新
  • 精选
  • 置顶
    我想也许是雅虎的企业文化太缺乏推动力,商业团队的内心里可能从未认真想过能快速有效的将技术转化为商业
    3
  • 范深
    产品和商业的创新和升级,并不能完全通过算法或技术来弥补。
    5
  • 王远方
    由雅虎开发的 Hadoop 对大数据的发展有很大推动,仅凭这点雅虎就值得尊重。
    4
  • 兔子ORZ
    企业环境:没有盈利压力,长时间的投入一项研究,更能出成果。 研发流程:研发目标最好是和公司现有或未来目标一致,能发挥想象力开发新战略的更好。
    2
  • 潜行
    人工智能不能靠发paper为主,学术界和工业届还是有差距的,比如阿里达摩院成立的时候马云就强调研究成果要保证能落地。
    1
  • Lynn
    到底什么样的企业环境能够最好地发挥研究院的成果? 研究结果可以很好的落地到项目中,才会使研究成果变现成为可能。 让研发成果的嵌入像系统核心模块一样存在,并且完善A/B Test机制,让研究成果可感知。 又是怎样的研发流程能够使研究院成为公司新动力的源泉? 首先公司在大环境下要了解并且相信研究院的价值。 第二公司战略清晰,公司产品明确,公司业务的核心强依赖研究成果,自然研究院会被定位成源泉。 第三研究院和业务部门跨部门沟通顺畅,业务问题能够有效的转化为研究问题,会相互促进企业发展。
    1
  • 安乐天
    雅虎,施乐,IBM,AT&T这些工业界的研究院随着企业的兴衰而boom and bust.时也势也,IT世界迭代太快,企业如此,研究院也如此,人也如此
    1
  • 李佳
    看了这篇,不得不想到阿里刚刚成立了达摩院,也是要人有人,要钱有钱啊。从雅虎研究院的发展来看钱和大牛好像都不能解决问题,也不是保证啊,不过很期待。
    1
  • 帅帅
    这个团队太过厉害~~~~~ 一群特种兵混在市井之间的感觉~~~
  • Xuan
    研究的成果带来的利益能cover住研究本身的开销才能长久的存在吧
收起评论
显示
设置
留言
10
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部