升华文本Html字计数器
我有一个HTML文档,升华文本Html字计数器,html,regex,sublimetext3,Html,Regex,Sublimetext3,我有一个HTML文档,mystory.HTML。本文件包含以下内容: <body> <p>Hello World!</p> <p>This document holds seven words.</p> </body> 你好,世界 这份文件有七个字 我希望能够使用cmd+f并通过正则表达式找到所有不是HTML标记的单词。我会通过软件包安装程序下载一个在HTML中计算单词数的插件,但它并不存在( 我使用了
mystory.HTML
。本文件包含以下内容:
<body>
<p>Hello World!</p>
<p>This document holds seven words.</p>
</body>
你好,世界
这份文件有七个字
我希望能够使用cmd+f
并通过正则表达式找到所有不是HTML标记的单词。我会通过软件包安装程序下载一个在HTML中计算单词数的插件,但它并不存在(
我使用了下面的正则表达式来尝试做类似的事情,但它的问题是它计算bod中的
bod
,如果任何标记名长度大于1,正则表达式也会选择它。代码是(?:)[a-zA-Z']+(?!>)
。这些标记都没有任何属性或css。基本上,我想计算文档中非HTML标记的字数。如果有人知道插件,我也会接受这个答案。您可以使用正则表达式:
\b[\w']+\b(?!>)
- 词界
- 后面跟着一个词
- 后跟单词边界
- 不后跟
>