Regex 以下场景的Perl正则表达式

Regex 以下场景的Perl正则表达式,regex,perl,pattern-matching,match,Regex,Perl,Pattern Matching,Match,我是vimal,我需要帮助匹配以下案例的模式 我在HTML文件中有一些类似的文本: F&#x00FC;r Clemens, <br/>Gotthard und Hermine</p> F&#x00FC;r Clemens, <br/>Gotthard und Hermine </s> F&#x00FC;r Clemens, <br/>Gotthard und Hermine </p> F

我是vimal,我需要帮助匹配以下案例的模式

我在HTML文件中有一些类似的文本:

F&#x00FC;r Clemens, <br/>Gotthard und Hermine</p>
F&#x00FC;r Clemens, <br/>Gotthard und Hermine </s>
F&#x00FC;r Clemens, <br/>Gotthard und Hermine
</p>
Fü;r克莱门斯,
哥达和赫敏

Fü;r克莱门斯,
哥达和赫敏 Fü;r克莱门斯,
哥达和赫敏

my$string=“哥达和赫敏”; 我想匹配“Gotthard and Hermine”这个,我用
($string)[\s]*

但是,如果匹配文本之间出现任何标记,则我无法匹配此项 例如:
Fü;r克莱门斯,
哥达和赫敏

我需要你的帮助,朋友们,请帮我解决这个问题


提前感谢

如果您只想测试查看html页面中是否有纯文本,那么您可以使用简单的方法,使用或某些等效模块剥离所有标记

use strict;
use warnings;

use HTML::Strip;

my $hs = HTML::Strip->new();

my $clean_text = $hs->parse( q{F&#x00FC;r Clemens, <br/>Gotthard <b>und</b> Hermine </s>} );

if ($clean_text =~ /Gotthard\s+und\s+Hermine/) {
    print "found\n";
}

您可能需要:

(Gotthard.*und.*Hermine)
这也将匹配中间的所有html标记。 例如<代码>哥特哈德和赫敏

此处演示:

现在假设在HTML标签中有HelMin或GOTHARD,在这种情况下,您可能需要这个ReEX,也将考虑结束标签而不包括它们

[>](.*Gotthard.*und.*Hermine.*)[<]

[>](.*Gotthard.*und.*Hermine...[]你想匹配什么?告诉我们?是不是从

我想匹配“Gotthard und Hermine”,即使这个字符串有“Gotthard und Hermine”这样的内部标记注意:我将通过一个变量进行匹配gotthard是否也可能类似于
gotthard
,您需要更详细地解释我们如何知道什么是允许的,什么是不允许的。
gotthard.*und.*Hermine
将包含这三个单词的任何字符串与它们之间的任何内容进行匹配,包括任意复杂的标记树,但不匹配这可能没什么用。朋友,我更新了我的问题,请看谢谢Miller先生!我对perl真的很陌生,所以你可以在Examples上发布任何链接吗Hanks Aelor请看我更新的问题,通过一个名为$Strings的变量匹配。你不能用$string匹配它。你就是不能!
[>](.*Gotthard.*und.*Hermine.*)[<]