Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/redis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python nltk-以下代码中re的含义是什么_Python_Nltk - Fatal编程技术网

Python nltk-以下代码中re的含义是什么

Python nltk-以下代码中re的含义是什么,python,nltk,Python,Nltk,re在这里表示什么 def清洁htmlhtml: 从给定字符串中删除HTML标记。 :param html:要清理的html字符串 :键入html:str :rtype:str 首先,我们删除内联JavaScript/CSS: cleaned=re.subr?is.*,html.strip 然后我们删除html注释。这必须在移除常规组件之前完成 标记,因为注释可以包含'>'字符。 已清理=已清理的子文件夹s[\n]?,已清理 接下来,我们可以删除剩余的标记: 已清洁=已重新安装,已清洁 最后,我

re在这里表示什么

def清洁htmlhtml: 从给定字符串中删除HTML标记。 :param html:要清理的html字符串 :键入html:str :rtype:str 首先,我们删除内联JavaScript/CSS: cleaned=re.subr?is.*,html.strip 然后我们删除html注释。这必须在移除常规组件之前完成 标记,因为注释可以包含'>'字符。 已清理=已清理的子文件夹s[\n]?,已清理 接下来,我们可以删除剩余的标记: 已清洁=已重新安装,已清洁 最后,我们处理空白 已清洁=重新安装,已清洁 已清洁=重新安装,已清洁 已清洁=重新安装,已清洁 返回已清洗的条带 引发NotImplementedError若要删除HTML标记,请使用BeautifulSoup的get_text函数
re是一个模块,提供与Perl中类似的正则表达式匹配操作。它提供了一组函数,您可以通过re.{function_name}调用这些函数来处理正则表达式。看看:

它与nltk无关。首先需要学习python的基础知识。请在这里阅读,请阅读正则表达式文档