csv文件中的不同列值

csv文件中的不同列值,csv,distinct-values,Csv,Distinct Values,我有一个csv文件。 csv文件中的列-“SNo.StateName CityName AreaName PinCode NonServ.Area MessangerService备注”。 列CityName具有重复的值 在许多记录中,它有独特的价值(德里)。 java中是否有任何方法可以读取该csv文件并从该csv文件的列中获取不同的值。我能想到的唯一方法是逐行执行,并将每个值存储到数组类型结构中。使用集合结构(如HashSet或TreeSet)将确保值的唯一性 另一个选项不是您想要的,但根据

我有一个csv文件。 csv文件中的列-“SNo.StateName CityName AreaName PinCode NonServ.Area MessangerService备注”。 列CityName具有重复的值

在许多记录中,它有独特的价值(德里)。
java中是否有任何方法可以读取该csv文件并从该csv文件的列中获取不同的值。

我能想到的唯一方法是逐行执行,并将每个值存储到数组类型结构中。使用集合结构(如HashSet或TreeSet)将确保值的唯一性


另一个选项不是您想要的,但根据您的项目可能会起作用,即使用数据库而不是csv文件。然后,在列中选择不同的值变得非常容易。

df是您读取csv数据的地方

df[CityName].unique()

我无法使用数据库连接。我只能使用csv文件。我将尝试使用哈希集实现。哈希集不允许重复。我认为这是一个更好的方法。我已经使用过HashSet,现在它工作得很好。更正“例如:在许多记录中,它有重复值(德里)。”您使用的是哪个数据库?与数据库没有连接。我将只读取许多csv文件。为什么不创建满足您要求的temparory
.csv
文件呢。使用
SELECT unique(cityname)将临时csv文件创建到OUTFILE'/tmp/temp.csv'字段中,该字段以“,”结尾,也可以用“,”括起来“'行由表\u名称中的'\n'终止引用我认为使用HashSet更好,因为它不允许重复。无需创建临时csv文件。因此,使用csv文件中的所有记录创建哈希集将返回一个不同的列值。