Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 如何从一个html修改文件中grep一个链接,该文件以http开头,以.epub结尾?_Regex_Sed_Grep - Fatal编程技术网

Regex 如何从一个html修改文件中grep一个链接,该文件以http开头,以.epub结尾?

Regex 如何从一个html修改文件中grep一个链接,该文件以http开头,以.epub结尾?,regex,sed,grep,Regex,Sed,Grep,所以我有一个修改过的html文件,里面有一些链接,我想提取它们(grep或类似的),所以我只有以http://*开头,以扩展名.epub结尾的链接)。 我在stackoverflow上尝试了一些解决方案,但没有一个有效,因为我似乎无法提取任何内容。 我该怎么做呢? 编辑:链接在文件上的布局也如下所示:>http://........epub“class=“…”>grep-o'http://[^”你说你尝试了一些东西。你尝试了什么?现有的正则表达式解决方案与jpg有关,但它们在这里似乎不起作用。是

所以我有一个修改过的html文件,里面有一些链接,我想提取它们(grep或类似的),所以我只有以http://*开头,以扩展名.epub结尾的链接)。 我在stackoverflow上尝试了一些解决方案,但没有一个有效,因为我似乎无法提取任何内容。 我该怎么做呢?
编辑:链接在文件上的布局也如下所示:
>http://........epub“class=“…”>
grep-o'http://[^”你说你尝试了一些东西。你尝试了什么?现有的正则表达式解决方案与jpg有关,但它们在这里似乎不起作用。是的,你说了,但它们是什么。这些都不会产生任何结果,我的链接是http,不是https,我不知道它是否会影响它。链接在文件中也像这样排列:`>http://.....…epub“class=“…”>是否使用https并不重要。但您的地址似乎不是实际的链接,而是文本。请尝试一下:
grep-Po'\bhttp://((?!http://)[^“仍然没有什么,如果有帮助,它们的格式如下:http://.../download/.../filename.epub“好吧,那就有问题了。如果连
grep-o'http://[^”这里是它的一部分,然后它在整个文件上重复数千次,但我真正感兴趣的是http*.epub。