Python重新提取模式后的第一个单词

Python重新提取模式后的第一个单词,python,regex,Python,Regex,试图在一个巨大的文本块中找到一个模式“到目的地”。 使用以下命令: pattern = re.compile("to (.*)") string = #text blob pattern.search(string) # When I see the output >>> _.group(1) DestinationLocation blah blah blah ... 如何从捕获的文本中仅提取“DestinationLocation”?如果要查找仅由字母字符组成的单词,长度

试图在一个巨大的文本块中找到一个模式“到目的地”。 使用以下命令:

pattern = re.compile("to (.*)")
string = #text blob
pattern.search(string)
# When I see the output
>>> _.group(1)
DestinationLocation blah blah blah ...

如何从捕获的文本中仅提取“DestinationLocation”?

如果要查找仅由字母字符组成的单词,长度为1或更多,而不占用以下空格,请使用
\w+
(单字母长度为1+):

现在,如果单词实际上是单词(如
到mall
),则需要一些字符来指示单词序列的结尾,如
到mall.
(点限制器),以及包含可用字符集的空格,以点结尾:

pattern = re.compile("to ([\w ]+)\.") 

要查找仅由字母字符组成的单词,长度为1或更多,而不占用以下空格,请使用
\w+
(单字母长度为1+):

现在,如果单词实际上是单词(如
到mall
),则需要一些字符来指示单词序列的结尾,如
到mall.
(点限制器),以及包含可用字符集的空格,以点结尾:

pattern = re.compile("to ([\w ]+)\.") 

因为DestinationLocation是任何记录或未记录位置名称的占位符。我必须提取的单词位于“to”之后,它可以是任何单词,因此不能使用搜索。因此,您正在查找一个没有特定格式但在“to”之后出现一次的单词?那么,
\b到\b.*\b
to
在那里发生了多少次?可能是一个地方的名称或其机场代码。像Miami或MIA。@Ben:是的,在to之后的任何第一个单词,都不包含以下单词。因为DestinationLocation是任何记录或未记录位置名称的占位符。我必须提取的单词在“to”之后,它可以是任何单词,所以不能使用搜索。所以你在寻找一个没有特定格式但在“to”之后出现一次的单词?那么,
\b到\b.*\b
to
在那里发生了多少次?可能是一个地方的名称或其机场代码。像迈阿密或米娅。@Ben:是的,在to之后的任何第一个词,都不包括下面的词。