使用python集数据结构解析txt_Python

使用python集数据结构解析txt

python

使用python集数据结构解析txt,python,Python,我如何解析它，以便无论后面有多少个唯一的URL，都能获得它？使用python，您可以使用regex从文件中每行解析和提取UID import re uids = set() with open('...') as f: for line in f: m = re.match('$[a-z0-9]+', line) if m: uids.add(m.group(0)) print(len(uids)) 您可以使用以下命令打开文件

我如何解析它，以便无论后面有多少个唯一的URL，都能获得它？使用python，您可以使用regex从文件中每行解析和提取UID

import re

uids = set()
with open('...') as f:
    for line in f:
        m = re.match('$[a-z0-9]+', line)
        if m:
            uids.add(m.group(0))

print(len(uids))

您可以使用以下命令打开文件并以字符串形式获取行：

with open("/path/to/file.txt") as file:
    lines = list(file)

这将为您提供文本文件中所有行的列表。既然你们不想要复制品，我认为使用set是一个好方法。（集合不包含重复项）

这将遍历所有行，并在空格后添加零件，直到，但不包括：到集合中，这将处理重复的情况。现在答案应该包含所有唯一的URL

测试Python3.6

import re
A, List = ("String_1   URL_1:10\nString_2   URL_2:20\nString_3   URL_1:30".replace("   ", ",")).split("\n"), []
for x in range(len(A)):
    Result = re.search(",(.*):", A[x])
    if Result.group(1) not in List:
        List.append(Result.group(1))
print(len(List))

这应该可以解决您的问题。

您正在阅读的文件是什么？请提供更多信息。是的，它只是一个这种格式的txt文件“我如何解析它，以便无论后面的数字是多少，我都可以获得多少个唯一的URL？使用python”-通过用python编写一个程序来解析此文件，然后询问您是否卡住了。

import re
A, List = ("String_1   URL_1:10\nString_2   URL_2:20\nString_3   URL_1:30".replace("   ", ",")).split("\n"), []
for x in range(len(A)):
    Result = re.search(",(.*):", A[x])
    if Result.group(1) not in List:
        List.append(Result.group(1))
print(len(List))