Cloudera新的开源储存引擎 Kudu

来源:转载


据外媒报道,大数据公司 Cloudera 正在开发一个大型的开源储存引擎 Kudu,用于储存和服务大量不同类型的非结构化数据。预计本月底发布。

Kudu 将被当作目前广泛使用的 Hadoop Distributed File System 和 Hadoop-oriented HBase NoSQL 数据库的替代产品,并将集合两者的特点。Kudu 将遵循 Apache 协议开源。

据说,Kudu 的扫描速度几乎和原生 HDFS 一样快,同时随机访问速度和 HBase 几乎一样快。不过,Kudu 并不打算替换掉 HDFS 或 HBase。Cloudera 未来也会继续支持 HDFS 和 HBase 。

Kudu 可用于时间序列数据,实时报告,模型构建。但它不是一个 SQL 查询引擎用来 pull 特定数据。Kudu 将集成 Impala,未来也将支持 Spark。此外,Kudu 的 API 可以使用 Java 和 C++。

Kudu相比较hbase而言可以进行改操作,就是可以将录入的数据进行改变,这样进一步加大了hadoop处理大数据的能力和范围,增加了应用的领域,主要面向反欺诈,风险评估等多种应用。



分享给朋友:
您可能感兴趣的文章:
随机阅读: