Regex 需要使用正则表达式获取RSS提要的某些部分的帮助吗

Regex 需要使用正则表达式获取RSS提要的某些部分的帮助吗,regex,rss,Regex,Rss,我需要使用正则表达式从下面的RSS提要中提取公司名称(JTA连接)以及截止日期和位置,最好不要包含“截止日期:”和“位置:”部分 <description>JTA Connection Oy<br /> Työsuhde: <br /> Työn laatu: <br />Deadline: 07.09.2011<br />Location: Avoin<br /></description> JTA连接日期蒂

我需要使用正则表达式从下面的RSS提要中提取公司名称(JTA连接)以及截止日期和位置,最好不要包含“截止日期:”和“位置:”部分

<description>JTA Connection Oy<br /> Työsuhde: <br /> Työn laatu: <br />Deadline: 07.09.2011<br />Location: Avoin<br /></description>
JTA连接日期
蒂奥斯德:
蒂奥斯拉图:
截止日期:2011年9月7日
地点:阿沃因
在使用regex提取某些部分时,我有点不知所措,因此欢迎提供任何帮助。

公司名称:

<description>([^<]+)

([^RSS文件是一个xml文件,因此最好使用xml解析器对其进行解析。一旦有了描述部分,在大多数语言中将其分解为一个数组就很容易了,使用“Word:”比较字符串的开头就更有效了获取您感兴趣的数据。这不是我使用regex的目的。

谢谢,这是一种方法,顺便说一句,所有提要都具有相同的结构。
Deadline:\s([^<]+)
Location:\s([^<]+)
<description>([^<]+)<br\s?/>([^<]+)<br\s?/>([^<]+)<br\s?/>Deadline:\s([^<]+)<br\s?/>Location:\s([^<]+)<br\s?/></description>