社区编辑申请
注册/登录
赵修湘:关系型数据库替代者-Hive数据仓库
新闻 数据仓库
Hadoop是一款运行在廉价商用服务器之上的,能够对大量数据进行有效存储和处理的软件框架,主要由HDFS分布式文件系统和Mapreduce计算框架组成,而Hive分布式数据仓库构建于hadoop的hdfs和mapred之上,用于管理和查询结构化/非结构化数据的数据仓库。

2014年7月25日-26日,由51CTO传媒主办的2014 WOT全球软件技术峰会在北京富力万丽酒店召开。秉承专注技术、服务技术人员的理念,自2012年以来,WOT品牌峰会成功举办了三届,积累了大量的技术专家资源,获得了广大IT从业者和技术爱好者的一致认可,成为了业界重要的技术分享交流平台以及人脉拓展平台。

本次会议分为8个技术主题,分别是:数据库技术与应用,互联网架构分析,高效的技术团队,敏捷开发,实时计算与数据分析,移动应用,自动化运维,开源技术。51CTO作为本次峰会的主办方,将全程视频、图文直播报道这场数据的盛宴。

在WOT2014全球软件技术峰会***一天的实时计算与数据分析专场,来自EasyHadoop的开源社区创始人之一赵修湘老师为我们带来了主题为《Hive数据仓库实战》的主题演讲。分享了大数据时代的挑战以及Hive应用结构化/非结构化数据的数据仓库优势。

Hadoop是一款运行在廉价商用服务器之上的,能够对大量数据进行有效存储和处理的软件框架,主要由HDFS分布式文件系统和Mapreduce计算框架组成,而Hive分布式数据仓库构建于hadoop的hdfs和mapred之上,用于管理和查询结构化/非结构化数据的数据仓库。

赵修湘老师表示虽然Hadoop的hdfs和mapred已经能够很好的解决大数据的存储和分析问题,但是对于传统的数据分析人员来说,依然面临着理解mapred计算模型、自行开发代码实现业务逻辑等挑战。Hive的出现,***的解决了传统数据分析人员所面临的问题。Hive使用类SQL查询语法,***限度的实现了和SQL标准的兼容,是关系型数据库***的替代者。

以上是51CTO.com记者从一线为您带来的精彩报道。后续我们还有更加精彩的独家报道,敬请关注。

责任编辑:路途 来源: 51CTO.com

同话题下的热门内容

谷歌数据中心炸了超实用的 Linux 高级命令,运维同仁一定要懂!Kafka在美团数据平台的实践谷歌搜索突发全球性宕机系统成功率99.99%+,美团CI/CD流水线引擎演进实践大意了!平常不重视慢SQL,搞得现在系统要重构……全球随叫随到工程师报酬大比拼:逃过996,也逃不过Oncall!SQL优化这五个极简法则,直接让查询原地起飞!

编辑推荐

斩获BAT技术专家Offer,他到底经历了什么?支付宝即将下线收款业务:2018年1月1日起正式执行,网友炸锅了!我活着从柬埔寨技术“魔窟”逃出来了…甲骨文云平台全面升级,助力客户稳步上云一文看懂Java收费 附可替换方案!
我收藏的内容
点赞
收藏

51CTO技术栈公众号