Hadoop 使用pig从cassandra加载所需数据
我对猪/卡桑德拉负荷有疑问 Am使用pig使用CqlStorage从cassandra加载数据。像这样Hadoop 使用pig从cassandra加载所需数据,hadoop,cassandra,apache-pig,Hadoop,Cassandra,Apache Pig,我对猪/卡桑德拉负荷有疑问 Am使用pig使用CqlStorage从cassandra加载数据。像这样 data = LOAD 'cq://ks/cf' using CqlStorage(); 我只想通过过滤加载很少的数据,我想过滤的列是分区键,这里面有bug,所以我不能这样做 因此,计划使用pig进行过滤,b=通过col1对数据进行过滤=='something' 我的疑问是,pig是否从cassandra加载所有数据,然后进行过滤?或者它会将过滤条件发送到CqlStorage,以便仅从cas
data = LOAD 'cq://ks/cf' using CqlStorage();
我只想通过过滤加载很少的数据,我想过滤的列是分区键,这里面有bug,所以我不能这样做
因此,计划使用pig进行过滤,b=通过col1对数据进行过滤=='something'
我的疑问是,pig是否从cassandra加载所有数据,然后进行过滤?或者它会将过滤条件发送到CqlStorage,以便仅从cassandra加载所需的数据