csv文件中的不同列值_Csv_Distinct Values

csv文件中的不同列值

csv

csv文件中的不同列值,csv,distinct-values,Csv,Distinct Values,我有一个csv文件。 csv文件中的列-“SNo.StateName CityName AreaName PinCode NonServ.Area MessangerService备注”。列CityName具有重复的值在许多记录中，它有独特的价值（德里）。 java中是否有任何方法可以读取该csv文件并从该csv文件的列中获取不同的值。我能想到的唯一方法是逐行执行，并将每个值存储到数组类型结构中。使用集合结构（如HashSet或TreeSet）将确保值的唯一性另一个选项不是您想要的，但根据

我有一个csv文件。 csv文件中的列-“SNo.StateName CityName AreaName PinCode NonServ.Area MessangerService备注”。列CityName具有重复的值

在许多记录中，它有独特的价值（德里）。

java中是否有任何方法可以读取该csv文件并从该csv文件的列中获取不同的值。

我能想到的唯一方法是逐行执行，并将每个值存储到数组类型结构中。使用集合结构（如HashSet或TreeSet）将确保值的唯一性

另一个选项不是您想要的，但根据您的项目可能会起作用，即使用数据库而不是csv文件。然后，在列中选择不同的值变得非常容易。

df是您读取csv数据的地方

df[CityName].unique()

我无法使用数据库连接。我只能使用csv文件。我将尝试使用哈希集实现。哈希集不允许重复。我认为这是一个更好的方法。我已经使用过HashSet，现在它工作得很好。更正“例如：在许多记录中，它有重复值（德里）。”您使用的是哪个数据库？与数据库没有连接。我将只读取许多csv文件。为什么不创建满足您要求的temparory

.csv

文件呢。使用

SELECT unique（cityname）将临时csv文件创建到OUTFILE'/tmp/temp.csv'字段中，该字段以“，”结尾，也可以用“，”括起来“'行由表\u名称中的'\n'终止引用我认为使用HashSet更好，因为它不允许重复。无需创建临时csv文件。因此，使用csv文件中的所有记录创建哈希集将返回一个不同的列值。