Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/css/36.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Cassandra:基于非主键-Python删除记录_Python_Cassandra_Pyspark_Nosql_Datastax - Fatal编程技术网

Cassandra:基于非主键-Python删除记录

Cassandra:基于非主键-Python删除记录,python,cassandra,pyspark,nosql,datastax,Python,Cassandra,Pyspark,Nosql,Datastax,表: ID | OP_Type | Location | ---------+-----------------+------- 101 | D | NY | 102 | I | NJ | 103 | U | CA | 103 | D | GA | 要求:表的主键是ID。需要根据OP_类型列的值删除数据。示例OP_type=D。如果我想通过python处理它。。如何

表:

 ID      | OP_Type | Location   | 
---------+-----------------+-------
  101    |  D      | NY    |
  102    |  I      | NJ    |
  103    |  U      | CA    |
  103    |  D      | GA    |

要求:表的主键是ID。需要根据OP_类型列的值删除数据。示例OP_type=D。如果我想通过python处理它。。如何处理它。请给我一些同样的建议。

关于您的数据集和主键。

如果主键是ID列,则不能有两行包含相同ID(103)。将有一行包含最新插入的内容。但是,如果数据集的格式正确,则需要有一个复合主键(包含id和其他列以创建唯一性)

关于您的特定问题

您可以在op_type列上创建二级索引。然后,您可以执行select以获取所需的行,然后运行delete。问题是类似的。根据您的数据集和用例,有时会出现以下情况:

此外,为了理解它们并估计对集群的影响,可能会被证明是有价值的

Python


如果您想在Python上执行此操作,我建议您从开始。

了解。谢谢你的帮助Horia@我很高兴能帮上忙:)