批Hadoop之父与吴甘沙有关大数据的对话

2014-12-15 08:12:00 作者:宋家雨 分类 : 比特网

  大家已在第一时间看到了Hadoop之父Cloudera公司首席技术官Doug Cutting和英特尔中国研究院吴甘沙院长关于大数据原汁原味的对话(参见:Hadoop之父对话英特尔中国研究院院长吴甘沙)。所谓的批肯定不是批判,对于这样的泰斗级人物,只能是仰望,何来批判。批,就是批注,或者说是读后感。

英特尔中国研究院院长吴甘沙

  2020年攻克癌症

  在吴甘沙院长的谈话中说到,人类在于癌症战斗的这几十年间,癌症的治愈率仅仅提升了8%,其中非常重要的一个因素,就是有关癌症的基因组样本数据太少,影响了研究。随着大数据的进步,特别数据量的指数级增长,这就给癌症的大数据研究创造了条件,乐观地看,2020年,人类有望攻克癌症。

  批注:这当然是一件非常的好的事情。有资料显示,人基因组工程已经告罄,接下来是蛋白组学在临床中的应用。当蛋白组学和临床医学彻底结合的那一天,就是癌症被攻克的日子,不仅是癌症,相当多的疾病会因为这一技术突破,淡出人类的历史。我不是这方面的专家,无从判断,但通过高性能计算,大数据分析研究,如果能够造福人类,将是一件令人鼓舞的事情。让我们带着一个美好的愿望,期待事情的发生吧。

  数据咖啡馆

  数据咖啡馆是吴甘沙院长演讲中另外一个亮点,而且吴院长用“相逢不必相识,没有使用没有买卖”进行了表述。他表示,英特尔针对数据咖啡馆,从安全分析、使用审计和数据定价提供标准和方案

  批注:钦佩英特尔的眼光,一语中的,抓住大数据应用的主要问题。

  在我看来,数据咖啡馆的核心就是数据开放,技术问题尚在其次,数据开放才是重点。在美国,奥巴马总统多次呼吁从法律、法规的高度,呼吁开放数据,可谓高屋建瓴。但国内,特别是传统行业/企业,无不把数据视为核心资产,深恐有任何闪失和疏漏。

  据我了解,国内很多行业开展大数据过程中,数据绝对不能够离开内部的服务器,即使业务合作伙伴,只能够使用数据,但不可能得到数据。很多用户都知道所谓全数据分析更能够获取数据背后的奥秘。就像吴院长所说的,电商1+电商2的全面用户画像会更加精准。但问题在于,这个“+”怎么实现?

数据咖啡馆

数据咖啡馆

  我能够理解行业用户防贼般心态可以理解,就像我在“高速摸奶男和隐私保护”一文中所表述的,在当今这样的环境中,数据开放将是奢望。因此对于英特尔的数据咖啡馆在国内的前景,我并不乐观。在我看来,这不是一个经济收入的问题,而是一个意识的问题。 预计数据咖啡馆会有很长的路要走,希望越短越好。

  中国大数据至少落后两年

  这是Cloudera 公司副总裁苗凯翔先生的判断。

  苗凯翔表示,如果说2011年是中国大数据元年,距今也有几年的历史了,对于大数据特点,全数据分析等,国内也不陌生。金融、电信、政府等行业用户也尝试了很多大数据的应用,但从应用的水平来说,广泛性和深度,中国较之国外至少落后两年。

  苗凯翔不仅给出了判断,也给出了原因分析,国内没有一个专业的大数据服务提供商。他表示,Cloudera来了,Cloudera会促进大数据应用水平的提高。

  批注:Cloudera还是很会宣传的。但对于Cloudera来说,目前的舆论认知对其并不有利。在“大数据落地难 Hadoop难辞其咎”一文中就说到,很多行业用户把Hadoop作为大数据的代名词加以研究,浪费了大量的经历和时间,捡了芝麻丢了西瓜。这就是一个无奈的现状。

  苗凯翔先生在演讲中也说到了,Hadoop太复杂了,国内基本上没有什么人可以搞定。作为一种开源平台,获取Hadoop很容易,但驾驭Hadoop就比较难了,特别对于传统行业/企业而言。所以应该关注大数据分析这个目标,而不是分析的平台。

  对于大数据,人们可以用习惯的方式,如SQL等成熟的工具进行分析。实际上,Splunk、Actian、GreenPlum、Vertica等都是非常成熟的工具,可以直接加以使用。不要为Hadoop耽误太多时间。

  对于Cloudera不利的是,大家熟悉Cloudera,更多是熟悉其Hadoop分发版。如此,Cloudera就与Hadoop建立对应关系,而Cloudera更具有价值的各种工具,其实并不为外界了解。我也不了解这些工具。当我跟Cloudera接触,希望进一步了解这些工具时,得到答复,还是需要结合具体的应用加以介绍。在我看来,这会困难重重。

  所以改变落后的局面,应该不乐观。

  Hadoop之父印象最深刻的案例

  也许是语言理解上的问题,总感觉Hadoop之父Doug Cutting先生演讲不够接地气。也许是在开源技术的熟悉程度上不够,总之能够激发的兴趣点不多。但Doug Cutting对2015年开源社区热点判断到也值得关注。Doug Cutting新的热点也许在于机器学习技术的泛化,更多会被应用到大数据的应用中。

Hadoop之父Doug Cutting

  另外一个亮点是Doug Cutting先生印象深刻的大数据应用案例。有两个,一个是一家信用卡企业,通过使用Hadoop集群,分析5年积累的数据,发现了一个金融欺诈方式被反复使用,借助Hadoop反欺诈取得很好的效果。另外一个是亚特兰大某儿童医院,通过对于婴幼儿ICU数据监测,改善服务。Doug Cutting表示,此前这些数据都不被保存,但通过数据监测,发现采血前后,各30分钟内,婴儿的脉搏加剧,表明处于一种紧张、惶恐的状态。通过这一发现,医护工作者可以提供针对的服务。这让Doug Cutting印象深刻。

  批注:发欺诈的大数据应用其实并不陌生。类似应用,在互联网领域较为普遍,生活中也会有接触。例如出差登陆QQ等,我们手机接到预警,其背后就是海量大数据监控。对此,有很好的客户体验。

  但让人不解的是,这么贴心的客户体验为什么不能贯穿全局呢。如果你遇到了QQ号被盗,你就会知道冻结账号的手续有多么糟糕。仅仅是服务电话的选择菜单就足够折腾了,当然这是题外话。对于打动Doug Cutting的案例,似乎有些缺乏新意。或者说,不够典型。当然,首先是理解上的障碍。当谈到华人对于开源社区贡献的障碍时,语言问题也被涉及,这真让人无语。

* 本文为ChinaByte比特网原创内容,版权所有,转载请注明出处和原文链接,未经授权请勿用于商业用途。

芥末视频

最近更新
科普

科普图集
带着朋友和机器人上月亮散步

带着朋友和机器人上月亮散步>>详情

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。