Python重新提取模式后的第一个单词_Python_Regex

Python重新提取模式后的第一个单词

python regex

Python重新提取模式后的第一个单词,python,regex,Python,Regex,试图在一个巨大的文本块中找到一个模式“到目的地”。使用以下命令： pattern = re.compile("to (.*)") string = #text blob pattern.search(string) # When I see the output >>> _.group(1) DestinationLocation blah blah blah ... 如何从捕获的文本中仅提取“DestinationLocation”？如果要查找仅由字母字符组成的单词，长度

试图在一个巨大的文本块中找到一个模式“到目的地”。使用以下命令：

pattern = re.compile("to (.*)")
string = #text blob
pattern.search(string)
# When I see the output
>>> _.group(1)
DestinationLocation blah blah blah ...

如何从捕获的文本中仅提取“DestinationLocation”？

如果要查找仅由字母字符组成的单词，长度为1或更多，而不占用以下空格，请使用

\w+

（单字母长度为1+）：

现在，如果单词实际上是单词（如

到mall

），则需要一些字符来指示单词序列的结尾，如

到mall.

（点限制器），以及包含可用字符集的空格，以点结尾：

pattern = re.compile("to ([\w ]+)\.")

要查找仅由字母字符组成的单词，长度为1或更多，而不占用以下空格，请使用

\w+

（单字母长度为1+）：

现在，如果单词实际上是单词（如

到mall

），则需要一些字符来指示单词序列的结尾，如

到mall.

（点限制器），以及包含可用字符集的空格，以点结尾：

pattern = re.compile("to ([\w ]+)\.")

因为DestinationLocation是任何记录或未记录位置名称的占位符。我必须提取的单词位于“to”之后，它可以是任何单词，因此不能使用搜索。因此，您正在查找一个没有特定格式但在“to”之后出现一次的单词？那么，

\b到\b.*\b

？

to

在那里发生了多少次？可能是一个地方的名称或其机场代码。像Miami或MIA。@Ben:是的，在to之后的任何第一个单词，都不包含以下单词。因为DestinationLocation是任何记录或未记录位置名称的占位符。我必须提取的单词在“to”之后，它可以是任何单词，所以不能使用搜索。所以你在寻找一个没有特定格式但在“to”之后出现一次的单词？那么，

\b到\b.*\b

？

to

在那里发生了多少次？可能是一个地方的名称或其机场代码。像迈阿密或米娅。@Ben:是的，在to之后的任何第一个词，都不包括下面的词。