[译]一图以蔽之:Hadoop在大数据企业应用中的崛起
点击标题下「大数据文摘」可快捷关注
?欢迎熟悉外语(含各种“小语种”)的朋友,加入大数据文摘翻译志愿者团队,回复“翻译”和“志愿者”了解详情。
大数据文摘翻译作品
翻译:孙沁
校对:康欣
欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权
对于试图分类和整理大数据科技,特别是 Hadoop的那些企业,这是一个振奋人心的全新信息图。这个对Hadoop的分析,也许能帮助公司的决策领导者更好地了解该技术平台。
![宽客网,量化投资,宽客俱乐部](https://v1cdn.cnq.net/file/2010/2156vqqbcyt0jze.png" />
1什么是Hadoop?Apache Hadoop是2005 年(由Apache Software Foundation)开发的开源软件框架,特别为大数据和大规模数据处理量身定制。它包含四个主要模块:
- Hadoop Common: 包含其它Hadoop模块所需的所有库和功能。
- Hadoop 分布式文件系统(Distributed File System),简称HDFS。它是一个文档储存系统,能够在数据集群间提供高带宽。
- Hadoop Yarn: 管理计算机集群中计算资源的平台,并利用这些资源做应用调度。
- Hadoop MapReduce:处理大规模数据的程序模块。
![宽客网,量化投资,宽客俱乐部](https://v1cdn.cnq.net/file/2010/2157bbhzgccyzgy.png" />
小贴士
![宽客网,量化投资,宽客俱乐部](https://v1cdn.cnq.net/file/2010/2158gaq4txyyqiu.png" />
超过170家公司正在致力于发展Hadoop,当前Hadoop框架的估值为20亿美元。2企业中的Hadoop使用Hadoop管理数据,2014年,每4家企业就有1家;2012年,每10家公司才有1家。
前5大应用行业:计算机制造业、商用服务、金融、零售和批发、教育和政府部门。
使用Hadoop的5大原因:低成本,计算性能,规模可伸缩性,存储灵活性,数据保护。
超过60%的公司表明,Hadoop补充或取代了他们现有的数据环境。
![宽客网,量化投资,宽客俱乐部](https://v1cdn.cnq.net/file/2010/2159t4bjz1ahkw5.png" />
3Hadoop的未来
61%的机构计划在不远的未来部署、或已经部分部署了Hadoop。
对基于Hadoop技术的全球销售额:截至2020年将达到50.2亿美元。
高德纳咨询公司(Gartner)表示:
“对Apache Hadoop使用对增长,正在促进着结构化数据的增长,引领企业去理解如何再利用数据,赋予数据新的用途,并从数据中获得至关重要的深入理解 。”
![宽客网,量化投资,宽客俱乐部](https://v1cdn.cnq.net/file/2010/2160ykehr2p0wia.png" />
4
完整信息图
来源:
http://insidebigdata.com/2014/10/18/current-state-hadoop-inforgraphic/
【译者简介】
有意联系译者,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢!
孙沁(Kiki):美国留学五年,现Emory University生物统计硕士在读。对Clinical Trails,Cancer Prevention, HIV/AIDS以及Food Science/Nutrition的领域很感兴趣。毕业后希望在Pharmaceutical/ Biotechnological/ Healthcare Industries/ Hospital工作,也想尝试医疗健康方向的咨询工作(Life Science Consulting)。希望结交对医疗数据有兴趣的朋友,也希望大家帮忙推荐此方向的实习和工作机会给我。
康欣:博士,西门子中国研究院高级研究员。多年从事图像及数据处理和分析、计算机视觉、模式识别、机器学习、增强现实等领域的技术研究和创新应用。希望借此平台,与大数据分析爱好者以及专家学者交流。
数据分析, 数据挖掘
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!