Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/linux/22.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Linux awk删除与html标记匹配的字符_Linux_Bash_Shell_Awk_Gawk - Fatal编程技术网

Linux awk删除与html标记匹配的字符

Linux awk删除与html标记匹配的字符,linux,bash,shell,awk,gawk,Linux,Bash,Shell,Awk,Gawk,我想从这个正则表达式中删除所有带有awk的html标记:/[]/如果在任何字段中找到了所述正则表达式。我一直试图使它与sub或substr一起工作,我无法找到正确的逻辑 输入文本: 知识是一种美德,是一种美德,是一种美德,是一种美德。但是,如果你是一个很小的志愿者,那么你就可以进行一次实习了。志愿者:培训:Comenzi volan;巡航控制;伺服定向 输出: 知识是一种美德,是一种美德,是一种美德,是一种美德。但是,至少要做一次练习,练习内容包括:Comenzi volan;巡航控制;伺服定向

我想从这个正则表达式中删除所有带有awk的html标记:/[]/如果在任何字段中找到了所述正则表达式。我一直试图使它与sub或substr一起工作,我无法找到正确的逻辑

输入文本:

知识是一种美德,是一种美德,是一种美德,是一种美德。但是,如果你是一个很小的志愿者,那么你就可以进行一次实习了。志愿者:
培训:Comenzi volan;巡航控制;伺服定向

输出:


知识是一种美德,是一种美德,是一种美德,是一种美德。但是,至少要做一次练习,练习内容包括:Comenzi volan;巡航控制;伺服定向

如果您不是真正解析HTML,而是只想删除文本文件中每对之间的所有内容,那么GNU awk for multi char RS就是这样:

$ awk -v RS='<[^>]+>' -v ORS= '1' file
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitationveniam: Confort:Comenzi volan; Cruise-control; Servodirectie;

尤其是sed的//]*>//g文件是您要查找的。但我相信这个问题在这里至少被问了一千次,如果不是更多的话@那么awk呢?你为什么这么热衷于使用awk?这不是适合这项工作的工具。请尝试php-R'echo strip_tags$argn。\n;'