如何在python中提取文本

如何在python中提取文本,python,regex,text,extract,Python,Regex,Text,Extract,假设我们有文本,其中列存储在表单中: ! Column1<NEWLINE>! Column2<NEWLINE>! Column3<NEWLINE>! Column4<NEWLINE> 您只需进行拆分即可 split\u text=text.split(!” 如果你想跳过第一步!此外,您还可以执行以下操作: split\u text=text[1:].split(!”re.findall('NEWLINE>!\s*)([^使用html解析器。 c

假设我们有文本,其中列存储在表单中:

! Column1<NEWLINE>! Column2<NEWLINE>! Column3<NEWLINE>! Column4<NEWLINE>

您只需进行拆分即可

split\u text=text.split(!”

如果你想跳过第一步!此外,您还可以执行以下操作:
split\u text=text[1:].split(!”
re.findall('NEWLINE>!\s*)([^使用html解析器。
 class="wikitable" style="float:right; text-align:center; margin:2em;"<NEWLINE>|+ Comparison of Union and Confederacy, 1860–1864<ref name="census74" /><NEWLINE>! id<NEWLINE>! Year<NEWLINE>! Union<NEWLINE>! Confederacy<NEWLINE>|-<NEWLINE>|rowspan="2"|'''Population'''<NEWLINE>|1860<NEWLINE>| 22,100,000 (71%)<NEWLINE>| 9,100,000 (29%)<NEWLINE>|-<NEWLINE>|1864<NEWLINE>| 28,800,000 (90%)
re.findall('NEWLINE>!\s*([^|]+)', text, re.MULTILINE)