Html 使用regex从文件中提取信息并需要帮助
我有一个html文件,它有一个信息表,我试图提取特定的列。模式如下,交替使用“TableDarkRow”和“TableLightRow”: 我试着想出了这个:Html 使用regex从文件中提取信息并需要帮助,html,regex,Html,Regex,我有一个html文件,它有一个信息表,我试图提取特定的列。模式如下,交替使用“TableDarkRow”和“TableLightRow”: 我试着想出了这个: >([0-9])+</A>(.*)NOWRAP> ?([0-9]{2}\/[0-9]{2}\/[0-9]{4}) >([0-9])+(*)NOWRAP>?([0-9]{2}\/[0-9]{2}\/[0-9]{4}) 但是(.*)允许在第一次和最后一次出现之间选择整个文档。试试这个(尚未测试): 将*替换为*?进
>([0-9])+</A>(.*)NOWRAP> ?([0-9]{2}\/[0-9]{2}\/[0-9]{4})
>([0-9])+(*)NOWRAP>?([0-9]{2}\/[0-9]{2}\/[0-9]{4})
但是(.*)
允许在第一次和最后一次出现之间选择整个文档。试试这个(尚未测试):
将
*
替换为*?
进行非贪婪匹配
参考资料:您可以将
*
替换为“[A-Za-z'\t]+”
817338284254611
01/14/2011
>([0-9])+</A>(.*)NOWRAP> ?([0-9]{2}\/[0-9]{2}\/[0-9]{4})
/[0-9\/ ]+/