Java 分隔文本和由html标记包围的文本的正则表达式

Java 分隔文本和由html标记包围的文本的正则表达式,java,regex,Java,Regex,我有这样的字符串: ____<b> <i> Hi</i> </b> my name is <i>Henry</i> and i'm very <span style=\"background-color: rgb(102, 102, 153);\">stylish</span> 你好,我叫亨利,很时髦 我正在寻找一种模式,将简单文本和带有HTML标记的文本分开,在我的示例中,我需要: ____

我有这样的字符串:

 ____<b> <i> Hi</i> </b> my name is <i>Henry</i> and i'm very <span style=\"background-color: rgb(102, 102, 153);\">stylish</span>
你好,我叫亨利,很时髦 我正在寻找一种模式,将简单文本和带有HTML标记的文本分开,在我的示例中,我需要:

____
<b> <i> Hi</i> </b>
 my name is 
<i>Henry</i>
 and i'm very 
<span style=\"background-color: rgb(102, 102, 153);\">stylish</span>
____
您好!
我的名字是
亨利
我非常高兴
时尚的
我尝试过这种模式:

"<[^>]*>][^</]*[\\s]*[<[^>]*>]|[^<[^>]*>][^</]*[\\s]*[^<[^>]*>]"
“]*>][^]|[^]*>][^]”

但他只在没有一个标记相互跟随时才工作好的,我找到了解决方案:

"<[^/]*[^>]*>{1,}[^</]*[\\s]*<[/]{1}[^>]*>{1,}|[^<[^>]*>][^</]*[\\s]*[^<[^>]*>]");
“]*>{1,}[^{1,}|[^]*>][^]”;