Regex 如何从一个html修改文件中grep一个链接,该文件以http开头,以.epub结尾?
所以我有一个修改过的html文件,里面有一些链接,我想提取它们(grep或类似的),所以我只有以http://*开头,以扩展名.epub结尾的链接)。 我在stackoverflow上尝试了一些解决方案,但没有一个有效,因为我似乎无法提取任何内容。 我该怎么做呢?Regex 如何从一个html修改文件中grep一个链接,该文件以http开头,以.epub结尾?,regex,sed,grep,Regex,Sed,Grep,所以我有一个修改过的html文件,里面有一些链接,我想提取它们(grep或类似的),所以我只有以http://*开头,以扩展名.epub结尾的链接)。 我在stackoverflow上尝试了一些解决方案,但没有一个有效,因为我似乎无法提取任何内容。 我该怎么做呢? 编辑:链接在文件上的布局也如下所示:>http://........epub“class=“…”>grep-o'http://[^”你说你尝试了一些东西。你尝试了什么?现有的正则表达式解决方案与jpg有关,但它们在这里似乎不起作用。是
编辑:链接在文件上的布局也如下所示:
>http://........epub“class=“…”>grep-o'http://[^”你说你尝试了一些东西。你尝试了什么?现有的正则表达式解决方案与jpg有关,但它们在这里似乎不起作用。是的,你说了,但它们是什么。这些都不会产生任何结果,我的链接是http,不是https,我不知道它是否会影响它。链接在文件中也像这样排列:`>http://.....…epub“class=“…”>是否使用https并不重要。但您的地址似乎不是实际的链接,而是文本。请尝试一下:grep-Po'\bhttp://((?!http://)[^“仍然没有什么,如果有帮助,它们的格式如下:http://.../download/.../filename.epub“好吧,那就有问题了。如果连grep-o'http://[^”这里是它的一部分,然后它在整个文件上重复数千次,但我真正感兴趣的是http*.epub。