Apache drill apachedrill的ValueVectors和apachearrow之间有什么区别?

Apache drill apachedrill的ValueVectors和apachearrow之间有什么区别?,apache-drill,apache-arrow,Apache Drill,Apache Arrow,ApacheDrill有自己的柱状表示,就像ApacheArrow一样。但是apachearrow支持更多的编程语言。我期待着使用ApacheDrill,但仍然希望获得ApacheArrow的编程语言支持 一些消息来源说,ApacheArrow源于ApacheDrill的ValueVectors Drill在内部将数据表示为JSON文档–类似于 MongoDB和Elasticsearch。这些JSON文档被分解为 列,它允许Drill提供 列分析,但保留查询复杂数据的能力。笔记 此内部表示不基于

ApacheDrill有自己的柱状表示,就像ApacheArrow一样。但是apachearrow支持更多的编程语言。我期待着使用ApacheDrill,但仍然希望获得ApacheArrow的编程语言支持

一些消息来源说,ApacheArrow源于ApacheDrill的ValueVectors

Drill在内部将数据表示为JSON文档–类似于 MongoDB和Elasticsearch。这些JSON文档被分解为 列,它允许Drill提供 列分析,但保留查询复杂数据的能力。笔记 此内部表示不基于Apache Arrow。-


为什么apachedrill不能使用apachearrow项目?Drill的内部表示与Apache Arrow有何不同?Arrow与Drill的ValueVectors相比有哪些优势?反之亦然。

Apache Arrow Java库作为Drill的ValueVectors的一个分支,始于2016年初的Apache Arrow项目。记忆表征基本相同;一个显著的区别是,箭头使用1位表示向量槽是否为空,而钻孔使用1字节。出于内存效率和使用popcount内在操作检查一批值是否包含空值的原因,我们决定更改此选项

已经讨论过是否在ApacheDrill中使用Arrow的表示形式,但没有时间表。相关问题是

ApacheArrow是作为一种开放标准开发的,在许多编程语言中都有一个公共API。我们现在通过本机实现或绑定对11种编程语言提供了一定程度的支持。这包括C、C++、C、GO、java、JavaScript、Matlab、Python、R、Ruby和Ru锈。
我不知道有任何性能分析会比较内存表示法,但与空表示法相关的差异不太可能导致显著差异

随着Apache Arrow项目于2016年初启动,Apache Arrow Java库开始作为Drill的价值向量分支。记忆表征基本相同;一个显著的区别是,箭头使用1位表示向量槽是否为空,而钻孔使用1字节。出于内存效率和使用popcount内在操作检查一批值是否包含空值的原因,我们决定更改此选项

已经讨论过是否在ApacheDrill中使用Arrow的表示形式,但没有时间表。相关问题是

ApacheArrow是作为一种开放标准开发的,在许多编程语言中都有一个公共API。我们现在通过本机实现或绑定对11种编程语言提供了一定程度的支持。这包括C、C++、C、GO、java、JavaScript、Matlab、Python、R、Ruby和Ru锈。
我不知道有任何性能分析会比较内存表示法,但与空表示法相关的差异不太可能导致显著差异

Drill的社区正在考虑转向Apache Arrow。请看以下门票: 但是现在它被搁置了,因为这两个项目都有很多变化和改进。因此,在术语、元数据表示法、数据类型和数据布局方面存在一些差异。。 您可以在drill dev邮件列表中回复此邮件线程以进一步讨论:
另外,也非常欢迎您的贡献:

Drill的社区正在考虑迁移到Apache Arrow。请看以下门票: 但是现在它被搁置了,因为这两个项目都有很多变化和改进。因此,在术语、元数据表示法、数据类型和数据布局方面存在一些差异。。 您可以在drill dev邮件列表中回复此邮件线程以进一步讨论: 此外,还非常欢迎捐款: