试读章节 您的演讲中打动了很多人的一部分内容是您曾经的失败经历。看到像您这么成功的人公然讨论自己过往的失败经历是挺让人惊讶的。您能更多地告诉我们一些相关内容吗? 在初入职场的时候,很多人都在挣扎面对的一个问题是,如何才能正确地走进这个领域的招聘市场。首先你要明白,当你走进去的时候,你必然已经把自己放在一个特定的“盒子”里呈现到了大家面前,而大家一定程度上会根据你所在的“盒子”来评估你所拥有的技能。比如说,如果你以一个销售人员的身份进入了人才招聘市场,大家就会默认你寻求的是销售职位;如果你以一个媒体人的身份进入市场,大家就会默认你对媒体公司有兴趣;如果你是生产产品的人,大家就会觉得你对于生产企业更感兴趣。在这个时候,相比形形色色的很多“盒子”,一些特定的“盒子”就更容易让你转入或转出相关的领域。 比如学术这个“盒子”就是一个非常不容易转型的例子。因为显而易见,在大家的印象中,你就是一个拥有学术背景的人。你所面对的问题有:我在目前的情况下有什么出路?如何转入其他的“盒子”里?我认为这方面一个颇具挑战的现状就是,组织机构和招聘人员更倾向于寻找与他们自己更类似的人。比如,在Ayasdi(一个拓扑机器学习公司)里,只有非常少量的数学家,却有非常多的拓扑学家。 对于大部分从学术界过来的人来说,招聘你就意味着公司可能需要在你身上冒一定的风险,除非你跟他们中的很多人有过非常非常多的沟通交流。我花了6个月才获得eBay的工作岗位。不要指望会有人在咖啡馆发现你,走过来跟你说:“嗨,你好,我看到了你在餐巾纸上写的那些东西,你一定是一个非常聪明的人!”工作不是这样找到的,在你获得机会之前,你必须要清楚地意识到,任何招聘你的人都是在你身上冒险。 在你的求职过程中,你一定会失败很多次,那是因为他们最终不愿意在你身上下注。在很多公司恶狠狠地把职位的大门对你毫不留情地关上之前,估计你是不太可能找到一份称心的工作的。并且,求职可不是你准备一篇稿子,然后在每一次需要介绍自己的时候,千篇一律地讲出来。而是需要你每一次都针对不同的聊天对象修改对自己的介绍和描述。其中的精髓正和做数据科学如出一辙,你需要不断地在展示自己和研究如何展示自己之间反复循环。 最终,有人愿意试试聘用你了,但是当你刚刚找到工作的时候,迎面而来的问题就是:如何在走进公司以后尽快地让自己的事业走上快车道?我认为目前数据科学领域的一大优势就是它并没有过于清晰的职位技能需求,所以很大一部分拥有偏才的人其实都是适合这个领域的。人们会说:“啊,你当然可以成为一名数据科学家!也许你的编程功底不如软件工程师那么出色,但是你研究问题以及运用工具解决问题的能力是相当出色的。” 公司里根本没有人知道具体该使用什么工具来解决正在面对的问题,所以你必须去搞清楚,而这恰好给予了你足够的自由度。一本还没有开始动笔的书,才有可能成为一本精彩的著作。 您能不能给我们一些起步的建议,例如您一开始在那个市场上是怎么做的,以及您如何想办法弄清楚那个领域内的“新人必知”之类的知识?新人如何在其中展现出自己的价值? 你首先需要做的就是,证明你可以完成一些任务,然后证明你可以创造一些东西。 我曾经让我的每一个研究生都做如下的测试——当我自己曾经还是一个研究生的时候,我经常在我的公寓附近散步并且喃喃自语:“我想要成为一个数学家。当我说‘数学家’的时候,它对我来说意味着什么?什么是每一个数学家都应该知道的事情?” 当我还是研究生的时候,我就是这样做的,然而经过一段时间的思考,我却得到了各种不同的结论。天知道我该怎么办!根本没有人对于数学家有一个很明确的定义啊!但是我觉得,一定还是应该有一些基准吧,毕竟都是过来人(数学家),对于一些问题还是应该有一些共识的。在思考了一段时间之后,我大概总结出了3~4个针对这些问题的不同观点和结论。而这其中,我觉得最重要的结论,就是那种让你在一个糟糕的想法上最终遭受失败以后,还能有机会转行到其他领域的结论。 基于上述的想法,我开始上大量形形色色的推公式的课程以及一堆概率统计课,尽管后者其实并不是我的研究方向。我给学生上课,我也知道如何编程,我曾经学过很多物理学知识——总而言之,我做每一件事的目的,就是希望它能给我带来更广阔的眼界和出路。 很多学术界的人技能都过于单一,只专注于特定的问题和纬度。他们并没有证明他们有能力创造任何东西,只是在不断证明他们可以学会一些没人关心的东西(除了他们的导师以及他们实验室过往两届的学生们)。在我眼里,这是不对的。其实在那一段时间里,你可以同时搞定你的博士研究课题,并且学会其他的一些技能。 比如说,除了在实验室的时间,你可以出去走走,多跟人交流,去参加一些课程充电,参加黑客马拉松活动,以及学习如何制作一些东西。正如我们绝对不会跟一个人说“你必须先学会做科研,然后再去学怎么跟人交流”一样。这些事情本应该是同时发生的,并且彼此相互协同促进。 所以我的论点就是,现在的科研人员完全不知道如何去创造一些东西。在你学会如何创造东西以后,你还需要学会如何讲故事,这样才能告诉大家你为什么想要做这个东西。 还有另一件学术界的人非常不擅长的事情。他们很喜欢滔滔不绝地说话,而不是静静地聆听你的需求,所以他们不太擅长倾听别人的问题在哪里。在学术界,你需要做的第一件事就是关上门,静静地坐在自己的桌子前。但是硅谷是没有门的!一旦走进企业界,你就好比走到了空旷的空地上一样。在第一次听到别人告诉他们“不,你必须要工作、合作、交流、沟通、竞争、辩论,而不是躲在门或者办公桌的背后”的时候,这些人往往都是一脸的震惊。 我觉得这正是学术界的不足之处:对这些方面的训练太少了。他们几乎没有机会参与团队合作,或者以小组的形式工作。 相反,现在的本科教育正在经历巨大的转变。如果我们比较一下过去几年和现在的大学里黑客马拉松、合作、小组项目一类的数量,我们就会发现转变的趋势。本科教育确实正在把学生训练成非常适合工作的一类群体。硕士生也有一些类似的机会,但是博士是几乎没有的。我觉得这种情况的原因主要是很多学者更愿意把学生训练成重复性的科研劳工,而不是设身处地为学生着想,让他们变得更适应社会,并且给他们选择自己人生路线的更多机会。(P2-4) 书评(媒体评论) “本书介绍了这些数据科学家亲身经历的成长过程,并慷慨地分享了他们的经历与智慧。” ——Harlan Harris 博士,数据科学教育咨询委员会主任 “作为一名数据科学家,我很喜欢本书提供的深度访谈,其中涵盖了数据科学领域的学习途径、应用开发,以及如何构建数据驱动的文化和团队……我觉得从入门新手到多年行家都能从中受益匪浅。” ——Ferris Jumah,Linkedin 数据科学家 “我很喜欢这本书,其中的每一篇采访都有一个精彩的故事,告诉我们这些数据科学家是怎么利用数据的……而这些都是我当年开始创业的时候想要听到的宝贵见解!” ——Rand Hindi,Snips 公司CEO,发表予《麻省理工科技评论第35期》 目录 第1章 重要问题的取舍 RelateIQ产品部副总裁DJ Patil 第2章 在成为成功的数据科学家之际 Fast Forward Labs创始人Hillary Mason 第3章 无处不在的软件开始用数据重构这个世界 Data Wrangling核心数据科学家Pete Skomoroch 第4章 学术期刊中的数据科学 《纽约时报》数据科学家Mike Dewar 第5章 通过数据倾听你的客户 Airbnb数据主管Riley Newman 第6章 建立你自己的数据科学课程表 Mattermark数据主管Clare Corthell 第7章 均方误差根无法解决所有社会难题 Project Florida数据主管Drew Conway 第8章 软件工匠学堂、软件工程及产品 Uber数据科学主管Kevin Novak 第9章 从天体物理到数据科学 Square数据科学家Chris Moody 第10章 数据科学中软件工程的重要性 Facebook数据工程师Erich Owen 第11章 弥合领域的鸿沟:从生物信息到数据科学 Ayasdi数据科学家Eithon Cadag 第12章 如何锻炼数据科学技能 Intuit数据科学家&创新George Roumeliotis 第13章 科学、工程和数据科学的交织 Palantir数据科学家Diane Wu 第14章 从高频交易到驱动个性化教育 Khan Academy 数据科学主管Jace Kohlmeier 第15章 针对数据科学与演讲能力的教育 哈佛大学应用统计学教授Joe Blitzstein 第16章 数据科学不是Kaggle竞赛 MailChimp科学家Jonh Foreman 第17章 数学、自谦以及成为更好的程序员 Cloudera数据科学主任Josh Wills 第18章 数据科学和学术界 UCSD计算神经科学教授,前Uber数据布道师Bradley Voytek 第19章 数据科学家的学术、量化金融与企业家之路 ttwick创始人/数据科学家Luis Sanchez 第20章 美国总统竞选就像物理科学一样 Civis Analytics数据科学家Michelangelo D'agostino 第21章 培养数据感觉的重要性 LinkedIn数据科学家主任Michael Hochster 第22章 数据挖掘、数据产品与企业家精神 Bento Labs联合创始人/CTO Kunal Punera 第23章 从战争建模到增强智能 Quid联合创始人/CTO Sean Courley 第24章 如何创建新颖的数据产品和公司 Intuit数据科学家主任Jonathan Goldman 第25章 从本科生到数据科学家 Quora数据科学家William Chen 序言 在过去的5年里,数据科学差不多对人类所有重要的研究突破领域,都产生过深远的影响。从商业到教育界,再到能源领域,当然,也包括软件与互联网产业,在全球范围内,数据科学在这些形形色色的产业中产生了巨大的价值。实际上,在2015年年初,美国总统发布了白宫的一个新职位——首席数据科学家,并且任命DJ Patil担此重任,而DJ Patil正是本书中的受访者之一。 与世界上其他的发明创造如出一辙,数据科学产业的诞生同样归功于一小群积极踊跃的人。在过去的几年里,正是他们让数据分析这一理念可以走进任何领域,慢慢从无到有,发展壮大,并最终深入人心。在本书中,你将有机会遇见这些开拓者中的一部分,聆听他们一路走来的、精彩纷呈的第一手故事,并且了解他们对于数据科学未来的发展预见。 成为数据科学家的道路并不总是一帆风顺的。当我曾经试图从实验物理学领域转向这个领域时,和如今相比,那时的资源是如此的稀缺。实际上,虽然当时公司里确实已经存在数据科学方面的岗位需求了,但这一类人却连一个正式、统一的职位名称都没有。我曾经花费大量的时间自学这个领域的知识,也在不同的产业项目中磨砺过,到头来却发现我在学术圈的朋友遇到了和我同样的挑战。 我见过许多拥有极高天分及多年科研领域经验的研究人员,由于心仪数据科学领域而选择转向其中,愿意成为与数据为伍的人,但却挣扎多年不得要领。简而言之,他们不知道如何将自身惊人的数学功底、计算天赋以及数据分析技巧用在工业界。与此同时,我在硅谷工作的时候发现,相当多的科技公司其实都急需这方面的人才。 为了填补学术界与工业界之间的鸿沟,我于2012年创建了深入理解数据科学研究(Insight Data Science Fellows Program)社群。该项目旨在组建一个帮助计量相关领域的博士从学术界向工业界转职的训练团队。在过去的几年中,我们已经帮助数百名项目成员,从诸如物理学、计算生物学、神经科学、数学以及工程学之类的科研背景转入工业界,在诸如Facebook、Arbib、LinkIn、纽约时报公司、斯隆-凯特琳癌症中心以及其他上百家企业公司中担任重要的数据科学家职位。 在我的个人过往经历中,一方面,我自己成功走进了科技产业;另一方面,我也创造了一个让更多的人走上这条路的团队社区。在此过程中,我发现对我的事业给予重要帮助的一个资源就是:更多地与那些成功完成事业转型的人沟通交流。鉴于我创建并发展了数据科学社群,我有机会与硅谷的一些最好的数据科学家沟通交流,他们绝对是业内顶尖的大师: Jonathan Goldman创建了LinkedIn公司最初的一个数据产品,即“你可能认识的人(People You May Know)”,该产品直接促使公司改变了它的发展战略。DJ Patil将LinkedIn内部的数据科学小分队发展壮大,最终发展成了该公司一个强大的部门,并且他也是“数据科学”这个术语最初的创造人之一。Riley Newman在Airbnb公司内致力于产品开发与分析,该工作对于Ailrbnb的发展可谓举足轻重。Jace Kohlmeier在可汗学院领导数据团队,致力于将上百万学子的网上学习最优化。 遗憾的是,想要与这些大师面对面交流是非常难的。在数据科学研究社群中,为了尽量争取与这些大师面对面交流高质量的内容,我们每年只会选择这样一群数据科学家以及工程师中的3位进行交流访谈。 本书把与这些大师的深度交流访谈整理出版,奉献给读者。 通过阅读本书中的访谈,你应该可以从这些前辈们的过往经历中学到一些知识并用于你自己的事业中,无论你现在身在何地,从事何业。每一篇访谈都是一次深度的交流,涵盖了这些科学家最初从菜鸟阶段起步,运用各种知识武装充实自己的经验,一直到最终成为数据科学家的事业全程。 并不只是早期的数据科学先驱们才有可能在这个领域做出卓越的贡献。这个领域源源不断地有新鲜血液注入,他们中的每一个人都有机会推动这个领域前进。在我遇到本书的作者们的时候,他们都曾只是梦想成为数据科学家的大学生,一个个急切地询问着那些每一个初入门道的人都想要了解的问题。 在18个月的努力学习过后,他们跑遍各地并寻访了全球的诸位顶尖数据科学家,探询了他们的观点、意见和指导。本书就是这些访谈的最终成果,将最出类拔萃的一群数据科学家的100小时以上的智慧汇集整理成册(想象一下你去和奥巴马总统都要抢时间与之交谈的DJ Patil对话)。 通过阅读这些内容丰富且非正式的访谈,你将会坐在领域先驱DJ Patil、Jonathan Goldman和Pete Skomoroch对面,他们都是LinkedIn早期的员工,也是LinkedIn内部数据科学团队的核心成员。你将会遇到Hilary Mason与Drew Conway,他们是声名远扬的纽约数据科学社区的主要发起人及推动人。你将会听到未来的数据科学领域先锋领袖(如Diane Wu和Chris Moody)的建议,他们都曾是数据科学研究社群的成员,现在他们正分别在MetaMinds和Stitch Fix公司大放异彩。 你将会遇到那些在学术领域有巨大影响力的科学家,例如加州大学圣迭戈分校的Bradley Voytek和哈佛大学的Joe Blitzstein。你也将见到初创公司里的数据科学家,例如Mattermark的Clare Corthell和Bento Labs的Kunal Punera,他们会告诉你他们如何将数据科学作为让自己更有竞争力的武器来运用。 本书中提到过的科学家们与其他的千万同僚们一起,曾经创建了许多形形色色的对这个世界产生重大影响力的公司和企业。在本书里,他们主要讨论了那些促使他们厘清误区、不断开疆拓土的心路历程,并且分享了他们人生中那些有特别意义的挑战或成功的故事,以及他们对于自己的团队所需要的人才的想法。 我希望读者通过阅读此书,聆听他们所思,学习他们对于未来的数据科学世界的眼界,并最终找到适合自己的数据科学之路。祝愿你们在这条路上做出自己对于世界的贡献,甚至于推进这个领域的前沿发展。 深入理解数据科学研究社群、深入理解数据工程研究社群、深入理解健康 数据科学研究社群的创始人 Jake Klamka 内容推荐 数据科学正在对商业、教育、能源、软件与互联网等各行各业产生深远的影响并贡献巨大的价值。作为21世纪诱人的职业,数据科学家既有巨大市场需求的潜力,又面临着高难度的学习路径的挑战。 单研、陈子蔚、汪强明、宋迈思著的《数据科学家访谈录》选取世界知名的25位数据科学家进行了深度的访谈,从不同的视角和维度,将他们的智慧、经验、指导和建议凝聚成册。每一篇访谈都是一次深度的交流,涵盖了这些数据科学家从菜鸟起步,运用各种知识武装和充实自己,一直到成为一名卓有成效的数据科学家的全过程。通过阅读本书中的访谈,读者可以形成对数据科学的宏观认识和了解,更深刻地认识和体验数据科学家的角色,并且从这些前辈的过往经历中学到宝贵的知识和经验以应用于自身的成长和事业中。 本书适合有志于成为数据科学家的人、正在从事数据科学相关工作的人、数据科学团队的领导和企业家以及商业人士参考,也适合对数据感兴趣的普通读者阅读。 编辑推荐 在单研、陈子蔚、汪强明、宋迈思著的《数据科学家访谈录》中,你将会看到作者对25位出众的数据科学家的访谈,他们来自于不同的背景、学科和行业。 作者既采访了Facebook、Linkedin和Intuit等公司的专家,也采访了Uber、Airbnb、Palantir、Mattermark、Quora、Square和Khan Academy等快速成长的初创公司的数据科学家。 其中的一些数据科学家,例如DJ Patil和Hillary Mason,是将这一领域开拓发展到如今这样的世界知名人士;另一些人,例如Clare Corthell,则是正在冉冉升起的数据科学新星。 本书提供了直观而深入的采访,展示了每一位数据科学家的生活经历,从他们离开学术界开始,到一步步成长为数据科学界的翘楚,以及他们在这个过程中学到的有价值的东西。 |