可以从Python中的CSVs行创建GUID吗?

可以从Python中的CSVs行创建GUID吗?,python,Python,假设我有以下格式的多个CSV: 2018/05/11T00:05:45,true,happy 2018/05/11T01:33:45,false,mad 2018/05/11T02:23:45,true,sleepy 假设CSV文件集合中存在重复行。我将把数据吸收到elasticsearch中,尽管不是一次全部。例如,我今天可以接收3个CSV文件,明天接收3个不同的文件。此外,我可能还无法访问明天的文件,但今天必须接收今天的文件,因此我无法对今天/明天的文件进行区分。两组文件之间可能存在重复的

假设我有以下格式的多个CSV:

2018/05/11T00:05:45,true,happy
2018/05/11T01:33:45,false,mad
2018/05/11T02:23:45,true,sleepy
假设CSV文件集合中存在重复行。我将把数据吸收到elasticsearch中,尽管不是一次全部。例如,我今天可以接收3个CSV文件,明天接收3个不同的文件。此外,我可能还无法访问明天的文件,但今天必须接收今天的文件,因此我无法对今天/明天的文件进行区分。两组文件之间可能存在重复的行,因此需要在接收时间之前为每行生成一个_id,以防止弹性索引中出现重复


使用Python如何为每行创建GUID,以便识别所有重复项?

您所说的“从中创建GUID”是什么意思?是否要使用行中的日期时间而不是当前日期时间创建variant-1或variant-2 UUID?为每行创建GUID如何帮助您识别重复项?您甚至需要GUID吗?创建一个空的
集合
S。然后,在遍历行时,将每个行转换为
元组
,然后检查它是否在S中。如果它不在S中,则它是唯一的,应添加到S中。如果它在S中,则它是重复的。@Blorgbeard是正确的。两个相同的值仍将生成不同的guid。这就是guid的要点,它们是全局唯一的。我认为您考虑的是
校验和
。我将连接所有值,然后得到它们的
校验和。看这里:开始吧