如何使用preg_replace PHP删除文本中的域名

如何使用preg_replace PHP删除文本中的域名,php,regex,preg-replace,Php,Regex,Preg Replace,我有如下示例文本: 纽约时报是最大的新闻门户网站之一,里面有很多内容。一些搜索引擎,如www.Google.com、www.yahoo.com和yandex.ru,将他们的爬虫程序发送到此网站。这也将Bing.com删除 所以我想使用regex preg_replace删除所有域。结果应该是: 最大的新闻门户网站之一,里面有很多内容。一些搜索引擎喜欢并发送他们的爬虫到这个网站。这也删除了 这是我失败的实验: $new_text = preg_replace('/s(.*?)\.(?:aero|a

我有如下示例文本:

纽约时报是最大的新闻门户网站之一,里面有很多内容。一些搜索引擎,如www.Google.com、www.yahoo.com和yandex.ru,将他们的爬虫程序发送到此网站。这也将Bing.com删除

所以我想使用regex preg_replace删除所有域。结果应该是:

最大的新闻门户网站之一,里面有很多内容。一些搜索引擎喜欢并发送他们的爬虫到这个网站。这也删除了

这是我失败的实验:

$new_text = preg_replace('/s(.*?)\.(?:aero|asia|biz|cat|com|coop|edu|gov|info|int|jobs|mil|mobi|museum|name|net|org|pro|tel|travel|ac|ad|ae|af|ag|ai|al|am|an|ao|aq|ar|as|at|au|aw|ax|az|ba|bb|bd|be|bf|bg|bh|bi|bj|bm|bn|bo|br|bs|bt|bv|bw|by|bz|ca|cc|cd|cf|cg|ch|ci|ck|cl|cm|cn|co|cr|cu|cv|cx|cy|cz|cz|de|dj|dk|dm|do|dz|ec|ee|eg|er|es|et|eu|fi|fj|fk|fm|fo|fr|ga|gb|gd|ge|gf|gg|gh|gi|gl|gm|gn|gp|gq|gr|gs|gt|gu|gw|gy|hk|hm|hn|hr|ht|hu|id|ie|il|im|in|io|iq|ir|is|it|je|jm|jo|jp|ke|kg|kh|ki|km|kn|kp|kr|kw|ky|kz|la|lb|lc|li|lk|lr|ls|lt|lu|lv|ly|ma|mc|md|me|mg|mh|mk|ml|mn|mn|mo|mp|mr|ms|mt|mu|mv|mw|mx|my|mz|na|nc|ne|nf|ng|ni|nl|no|np|nr|nu|nz|nom|pa|pe|pf|pg|ph|pk|pl|pm|pn|pr|ps|pt|pw|py|qa|re|ra|rs|ru|rw|sa|sb|sc|sd|se|sg|sh|si|sj|sj|sk|sl|sm|sn|so|sr|st|su|sv|sy|sz|tc|td|tf|tg|th|tj|tk|tl|tm|tn|to|tp|tr|tt|tv|tw|tz|ua|ug|uk|us|uy|uz|va|vc|ve|vg|vi|vn|vu|wf|ws|ye|yt|yu|za|zm|zw|arpa)/', '', $text);

有什么解决这个问题的方法吗?

类似的方法可以帮助您:

/([wW]{3,3}\.|)[A-Za-z0-9]+?\.(se|com|ru)/
用您需要的替换最后一个se | com | ru。尽管在这之后你会有这样的事情:

最大的新闻门户网站之一,里面有很多内容。 几个搜索引擎喜欢,并发送他们的爬虫到这个网站。 这也删除了


要删除开头的空格,可以执行trim$str,对于其他空格,可以使用类似preg_replace'/\s+/'、''$str;应该可以帮到你。

正则表达式/[A-Za-z0-9]+?\.se|com/至少做得更好一点,.*?因为域名不能包含0个字符或特殊字符,所以匹配的方式太多了。谢谢安东,这很有用!另外,对于trim和其他空间正则表达式也很好。我选择anton作为解决方案,因为它首先出现。你的回答更详细,对来这里的人来说更容易理解。无论如何谢谢你!
<?php

$patterrn='/([wW]{3,3}\.|)[A-Za-z0-9]+?\.(aero|asia|biz|cat|com|coop|edu|gov|info|int|jobs|mil|mobi|museum|name|net|org|pro|tel|travel|ac|ad|ae|af|ag|ai|al|am|an|ao|aq|ar|as|at|au|aw|ax|az|ba|bb|bd|be|bf|bg|bh|bi|bj|bm|bn|bo|br|bs|bt|bv|bw|by|bz|ca|cc|cd|cf|cg|ch|ci|ck|cl|cm|cn|co|cr|cu|cv|cx|cy|cz|cz|de|dj|dk|dm|do|dz|ec|ee|eg|er|es|et|eu|fi|fj|fk|fm|fo|fr|ga|gb|gd|ge|gf|gg|gh|gi|gl|gm|gn|gp|gq|gr|gs|gt|gu|gw|gy|hk|hm|hn|hr|ht|hu|id|ie|il|im|in|io|iq|ir|is|it|je|jm|jo|jp|ke|kg|kh|ki|km|kn|kp|kr|kw|ky|kz|la|lb|lc|li|lk|lr|ls|lt|lu|lv|ly|ma|mc|md|me|mg|mh|mk|ml|mn|mn|mo|mp|mr|ms|mt|mu|mv|mw|mx|my|mz|na|nc|ne|nf|ng|ni|nl|no|np|nr|nu|nz|nom|pa|pe|pf|pg|ph|pk|pl|pm|pn|pr|ps|pt|pw|py|qa|re|ra|rs|ru|rw|sa|sb|sc|sd|se|sg|sh|si|sj|sj|sk|sl|sm|sn|so|sr|st|su|sv|sy|sz|tc|td|tf|tg|th|tj|tk|tl|tm|tn|to|tp|tr|tt|tv|tw|tz|ua|ug|uk|us|uy|uz|va|vc|ve|vg|vi|vn|vu|wf|ws|ye|yt|yu|za|zm|zw|arpa)/';
$text="Nytimes.com One of the biggest news portals, have a lot of contents inside. Several search engine like www.Google.com, www.yahoo.com and yandex.ru send their crawler to this sites. This also Bing.comremoved";
$output = preg_replace($patterrn,"",$text);
print_r($output);

?>
One of the biggest news portals, have a lot of contents inside. Several search engine like , and send their crawler to this sites. This also removed