使用python搜索文件

使用python搜索文件,python,search,Python,Search,我的问题是当我使用python搜索pdf文件时。我逐行搜索它,因此假设我有一行包含: “此%this” 所以如果我们把 x=“this%this”我想计算“this”的数量,忽略“%”的结果,因为这是一个注释。代码是: if re.search("%",x): new_line = x.split() for g in new_line: if re.search("%",g): break elif g == "this"

我的问题是当我使用python搜索pdf文件时。我逐行搜索它,因此假设我有一行包含:

“此%this”

所以如果我们把 x=“this%this”我想计算“this”的数量,忽略“%”的结果,因为这是一个注释。代码是:

if re.search("%",x):
    new_line = x.split()
    for g in new_line:
        if re.search("%",g):
            break
        elif g == "this":
            counter = counter+1
    print (counter)
但如果我有以下几点:

x=“this%this%this”第二个百分比结束注释,我想跳过“%”之间的“this”并计算最后一个百分比

有人想做这件事吗?

你可以试试

data = "this this this %this %this"

data = ' '.join(data.split('%')[::2])

data # => "this this this  this"
x = re.sub("%[^%]*%?", "", x);

演示:

如果您以文本文件的形式打开PDF文件并试图解析出内容,请注意PDF文件通常不会像输出中显示的那样以连续文本字符串的形式存储其内容。解析原始PDF基本上是不可能的任务。非常感谢。如果你不介意的话,我可以问你更多的问题吗?它比你更有效,就像一个魔术。拜托,我正在做一个项目,如果你不介意的话,我需要进一步的帮助?