Hadoop 配置单元更新效率(版本0.14)
配置单元如何有效地处理未分区列上的更新 假设我想为未分区的特定transactionid更新一行,那么配置单元将如何在内部处理它。据我所知,Hive将首先搜索这个速度较慢的分区,然后更新存储此transactionid的特定行的特定分区(如果有)。Hadoop 配置单元更新效率(版本0.14),hadoop,hive,Hadoop,Hive,配置单元如何有效地处理未分区列上的更新 假设我想为未分区的特定transactionid更新一行,那么配置单元将如何在内部处理它。据我所知,Hive将首先搜索这个速度较慢的分区,然后更新存储此transactionid的特定行的特定分区(如果有)。 尽管这将为用户提供更新数据的抽象,但执行大量更新真的有效吗?行级更新在hadoop中可能不有效,因为hadoop是为大型数据处理而设计的。但是,从配置单元版本0.14开始,支持对支持ACID的配置单元表进行行级更新。有关如何实现行级更新的详细信息,请
尽管这将为用户提供更新数据的抽象,但执行大量更新真的有效吗?行级更新在hadoop中可能不有效,因为hadoop是为大型数据处理而设计的。但是,从配置单元版本0.14开始,支持对支持ACID的配置单元表进行行级更新。有关如何实现行级更新的详细信息,请参阅配置单元教程。
配置单元是否支持单独的行更新?从版本0.14开始,配置单元已开始支持更新。在这里查看更多详细信息:究竟为什么您希望使用Hive更新Hadoop上的一行?我不希望..我只是想知道如何在内部处理这些