升华文本Html字计数器

升华文本Html字计数器,html,regex,sublimetext3,Html,Regex,Sublimetext3,我有一个HTML文档,mystory.HTML。本文件包含以下内容: <body> <p>Hello World!</p> <p>This document holds seven words.</p> </body> 你好,世界 这份文件有七个字 我希望能够使用cmd+f并通过正则表达式找到所有不是HTML标记的单词。我会通过软件包安装程序下载一个在HTML中计算单词数的插件,但它并不存在( 我使用了

我有一个HTML文档,
mystory.HTML
。本文件包含以下内容:

<body>
    <p>Hello World!</p>
    <p>This document holds seven words.</p>
</body>

你好,世界

这份文件有七个字

我希望能够使用
cmd+f
并通过正则表达式找到所有不是HTML标记的单词。我会通过软件包安装程序下载一个在HTML中计算单词数的插件,但它并不存在(


我使用了下面的正则表达式来尝试做类似的事情,但它的问题是它计算bod中的
bod
,如果任何标记名长度大于1,正则表达式也会选择它。代码是
(?:)[a-zA-Z']+(?!>)
。这些标记都没有任何属性或css。基本上,我想计算文档中非HTML标记的字数。如果有人知道插件,我也会接受这个答案。

您可以使用正则表达式:

\b[\w']+\b(?!>)
  • 词界
  • 后面跟着一个词
  • 后跟单词边界
  • 不后跟
    >
这将返回7个匹配项