Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/354.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用python集数据结构解析txt_Python - Fatal编程技术网

使用python集数据结构解析txt

使用python集数据结构解析txt,python,Python,我如何解析它,以便无论后面有多少个唯一的URL,都能获得它?使用python,您可以使用regex从文件中每行解析和提取UID import re uids = set() with open('...') as f: for line in f: m = re.match('$[a-z0-9]+', line) if m: uids.add(m.group(0)) print(len(uids)) 您可以使用以下命令打开文件


我如何解析它,以便无论后面有多少个唯一的URL,都能获得它?使用python,您可以使用regex从文件中每行解析和提取UID

import re

uids = set()
with open('...') as f:
    for line in f:
        m = re.match('$[a-z0-9]+', line)
        if m:
            uids.add(m.group(0))

print(len(uids))

您可以使用以下命令打开文件并以字符串形式获取行:

with open("/path/to/file.txt") as file:
    lines = list(file)
这将为您提供文本文件中所有行的列表。 既然你们不想要复制品,我认为使用set是一个好方法。(集合不包含重复项)

这将遍历所有行,并在空格后添加零件,直到,但不包括:到集合中,这将处理重复的情况。现在答案应该包含所有唯一的URL

测试Python3.6

import re
A, List = ("String_1   URL_1:10\nString_2   URL_2:20\nString_3   URL_1:30".replace("   ", ",")).split("\n"), []
for x in range(len(A)):
    Result = re.search(",(.*):", A[x])
    if Result.group(1) not in List:
        List.append(Result.group(1))
print(len(List))

这应该可以解决您的问题。

您正在阅读的文件是什么?请提供更多信息。是的,它只是一个这种格式的txt文件“我如何解析它,以便无论后面的数字是多少,我都可以获得多少个唯一的URL?使用python”-通过用python编写一个程序来解析此文件,然后询问您是否卡住了。
import re
A, List = ("String_1   URL_1:10\nString_2   URL_2:20\nString_3   URL_1:30".replace("   ", ",")).split("\n"), []
for x in range(len(A)):
    Result = re.search(",(.*):", A[x])
    if Result.group(1) not in List:
        List.append(Result.group(1))
print(len(List))