Regex 如何从XML文件中提取带有表情符号的文本?

Regex 如何从XML文件中提取带有表情符号的文本?,regex,xml,twitter,extract,emoticons,Regex,Xml,Twitter,Extract,Emoticons,我有一个包含大量tweet的XML文件,希望提取包含表情符号的每条tweet的文本 XML文件如下所示: 573890929636941824 百安居酒店;超越杂志 您的Torrent客户端可能在未告知您的情况下挖掘比特币http://t.co/xhTdmAYD20 573890929628614656 03/08 @8900公主这就是我认为你是在开玩笑,这就是为什么我说为什么&128514;

我有一个包含大量tweet的XML文件,希望提取包含表情符号的每条tweet的文本

XML文件如下所示:

573890929636941824 百安居酒店;超越杂志 您的Torrent客户端可能在未告知您的情况下挖掘比特币http://t.co/xhTdmAYD20 573890929628614656 03/08 @8900公主这就是我认为你是在开玩笑,这就是为什么我说为什么&128514;