林海雪原

email | about | tags

微软收购Revolution Analytics:不相关的微软和R

13 Mar 2015     tags:  微软 |  R |  大数据

最近无意间查看邮件时点击看了一眼Revolution Analytics的网站,头条就是“Microsoft to Acquire Revolution Analytics”,还给出了微软的相关博客文章。看到这个新闻真是小有一点儿震惊,也算不上震惊,就是总觉得RA是做R的,和微软不太相关,微软是做操作系统的,还有办公软件,编程语言(当然R也是编程语言,这么说有点儿矛盾),数据库,等等,而且都是商业软件,开源的东西极少。相反,R是做数据分析的,初衷是给统计学家使用的,现在也大多是学院派在用,商用和生产级应用还是少数,而且以开发居多。这两样东西有点不相关,不过,话说RA倒是一直感觉和传统的R已经不一样了,相比较而言RStudio更像是一帮玩R语言的人,RA则采取了商业导向,为R做大数据支持,包括并行计算和Hadoop等的深入开发,同时提供商业版本并收取支持费用。

在简单搜索了这条新闻后,看到排在前面的一篇文章,是一个专栏文章,作者Dan Woods认为微软即使想走R路线,也没必要收购RA。按照Woods的分析,微软的主要目标可能就是要让Hadoop在她的云平台Azure上获得更好的应用,而R现在显然已经进入到大数据时代,RHadoop已经发展得较为成熟了。Woods还评论道,如果微软就是想让R和Hadoop能更好地在Azure上工作,那么她的目的已经可以说能够实现了。实际上,作者的观点就是更加倾向于Tibco的做法,就是将R进行重新的整合,然后纳入自己的产品体系当中。

实际上,这里的问题就是一家商业软件公司和开源语言之间的关系。关于R的一些优势和不足,很多文章都在探讨,关注的人也大体能够熟悉一些主流观点,就其不足而言,最集中的观点莫过于一再强调R不是计算机专家的作品,而是统计学家们的作品,R最初的初衷应该就是好用。这一点即使是对于今天刚刚开始使用R的人来说都很明显,几个简单的函数完全可以帮助学生们完成他们的统计学或者计量经济学作业。同时,就算使用R做编程也不是什么很难的事情,把函数组织在一起就可以了,加上一些简单的判断和循环,就可以完成不少批量化的工作。不过对于计算机专家而言,R可能还不够扎实和严谨,特别是在应用于大负荷工作和生产级应用时,可能让人觉得不够靠谱。但既成事实是,R的好用好学恰恰使其越来越普及,起码在数据分析领域的普及率很高,加上其开源的本质,带来了两大好处:一是学习的经济成本低,很多学生都可以无压力的学习,现在大量的学生毕业了,会使用R的使用者群体不断扩大;二是扩展性很强,任何人都可以制作满足自身需求的Package。这样的既成事实使得今天的微软也不能忽视R了。

那么,问题在于微软这样的商业软件公司到底该如何对待R?我认为微软收购RA以及其后续的整体战略打算可能都是合适的!道理很简单:即使我不知道微软下一步打算做什么,但是作为商业软件公司就是要提供产品和工具,目前的数据分析越来越成为更多企业的工作重心,那么微软构建基于业界十分流行的语言平台的产品和服务,怎么说都是对的。是否可以大胆评论说,这就类似于C/C++或者SQL数据库嘛!人们对于C/C++的应用时很普遍的了,各种IDE和工具也不计其数,其中微软的Visual Studio是最为主流的一个,对于SQL数据库也是一样的,微软的SQL Server也是主要的产品之一。可能未来在数据分析工具平台当中,微软的R平台也会一样,既有IDE,也会整合数据库、云计算等服务。人们就像学习C/C++、SQL语法一样,可以毫无障碍学习和训练使用R语言,也可以使用各种工具应用和部署R程序,但是进入到商业阶段和生产阶段,就可以根据实际需要选择和部署微软的R平台,当然,前提是微软的产品有足够的竞争力。

不管怎样,微软无法阻挡R的开源,R开源不开源其实跟微软也没有关系,她已经成为业界标准之一。但是让人开心的是,前几年还极其小众的R目前已经赢来了微软的拥抱,不得不让人感慨!