R:基于模式将多行拆分为列表元素

R:基于模式将多行拆分为列表元素,r,parsing,R,Parsing,我正试图在R中解析此.txt文件: 它本质上是一个约200万行的单列数据帧,每个实体由多行描述,并由包含字符串“/”的行组成 理想情况下,我可以通过在“/”处拆分将由多行组成的每个实体捕获为一个列表元素,但我不确定最有效的方法 非常感谢您的帮助 编辑: 以下是我正在处理的一个片段: [87]“/” [88]“ID#40a” [89]“AC CVCL_IW91” [90]“维基数据博士;Q54422071” [91]“RX PubMed=28159921;” [92]“CC特征:在C57BL/6小

我正试图在R中解析此.txt文件:

它本质上是一个约200万行的单列数据帧,每个实体由多行描述,并由包含字符串“/”的行组成

理想情况下,我可以通过在“/”处拆分将由多行组成的每个实体捕获为一个列表元素,但我不确定最有效的方法

非常感谢您的帮助

编辑:

以下是我正在处理的一个片段:

[87]“/”
[88]“ID#40a”
[89]“AC CVCL_IW91”
[90]“维基数据博士;Q54422071”
[91]“RX PubMed=28159921;”
[92]“CC特征:在C57BL/6小鼠(PubMed=28159921)腹腔内传代两次后,从母细胞系建立。”
[93]“CC转化子:ChEBI;ChEBI:46666;青石棉。”
[94]“来源于转移部位的CC:腹膜。”
[95]“CC品种/亚种:C57BL/6。”
[96]“DINCIT;C21619;小鼠间皮瘤”
[97]“牛NCBI_TaxID=10090;!小家鼠”
[98]“嗨,CVCL_IW90!40”
[99]“SX男”
[100]“AG 1-2M”
[101]“CA癌细胞系”
[102]“DT创建日期:15-05-17;上次更新日期:02-07-20;版本:3”
[103] "//"                                                                                                                                                                                             
[104]“ID#490”
[105]“AC CVCL_B375”
[106]“SY 490;Mab 7;Mab 7”
[107]“CLO博士;CLO_0001018”
[108]“ATCC博士;HB-12029”
[109]“维基数据博士;Q54422073”
[110]“RX专利=US5616470;”
[111]“CC单克隆抗体同型:IgM,kappa。”
[112]“CC单克隆抗体靶点:Cronartium ribicola抗原。”
[113]“牛NCBI_TaxID=10090;!小家鼠”
[114]“嗨,CVCL_4032!P3X63Ag8.653”