8月5日消息,知名大数据开源社区Hadoop近日宣布对腾讯云对象存储COS的正式支持。后续,开发者在基于Hadoop架构进行大数据分析时,能够在不修改代码的情况下,无缝高效地使用腾讯云COS来处理海量数据的读写任务。
大数据分析需要花费大量的计算和存储资源。在传统模式下,计算与存储资源耦合度较高,一旦资源不够,就需要对二者同时进行扩容。近年来,在云计算的推动下,开发者逐渐开始采用云上对象存储,来实现计算与存储的分离,进而提升资源的灵活性,并降低成本。
Hadoop是目前应用最为广泛的分布式大数据处理框架,也是大数据处理领域事实上的标准。在数据价值越来越被重视的时代,Hadoop也在互联网、政务、金融等行业中被广泛使用。
腾讯云对象存储COS是一种具备安全稳定、海量、便捷、低延迟、低成本等特点的云端分布式存储服务,其底层采用腾讯自研存储引擎YottaStore,能够实现单集群理论管理百万级节点,并且做到真正的按需扩容,磁盘利用率达到 90% 以上。
Hadoop社区支持腾讯云对象存储以后,开发者在基于Hadoop架构进行大数据分析时,能够无缝使用到腾讯云对象存储COS提供的高速云存储服务。
“开发者在腾讯云上可以使用弹性 MapReduce(EMR)计算,并直接使用腾讯云对象存储COS作为后端存储,整个过程都不需要额外添加代码,更加方便和快捷。”腾讯云对象存储负责人介绍。
目前,小红书、猎豹移动、珍爱网等就使用了腾讯云“EMR on COS”的计算与存储分离模式,快速构建和部署大数据分析程序,有效地满足了大数据业务需求。