R：基于模式将多行拆分为列表元素_R_Parsing

R：基于模式将多行拆分为列表元素

r parsing

R：基于模式将多行拆分为列表元素,r,parsing,R,Parsing,我正试图在R中解析此.txt文件：它本质上是一个约200万行的单列数据帧，每个实体由多行描述，并由包含字符串“/”的行组成理想情况下，我可以通过在“/”处拆分将由多行组成的每个实体捕获为一个列表元素，但我不确定最有效的方法非常感谢您的帮助编辑：以下是我正在处理的一个片段： [87]“/” [88]“ID#40a” [89]“AC CVCL_IW91” [90]“维基数据博士；Q54422071” [91]“RX PubMed=28159921；” [92]“CC特征：在C57BL/6小

我正试图在R中解析此.txt文件：

它本质上是一个约200万行的单列数据帧，每个实体由多行描述，并由包含字符串“/”的行组成

理想情况下，我可以通过在“/”处拆分将由多行组成的每个实体捕获为一个列表元素，但我不确定最有效的方法

非常感谢您的帮助

编辑：

以下是我正在处理的一个片段：

[87]“/”
[88]“ID#40a”
[89]“AC CVCL_IW91”
[90]“维基数据博士；Q54422071”
[91]“RX PubMed=28159921；”
[92]“CC特征：在C57BL/6小鼠（PubMed=28159921）腹腔内传代两次后，从母细胞系建立。”
[93]“CC转化子：ChEBI；ChEBI:46666；青石棉。”
[94]“来源于转移部位的CC：腹膜。”
[95]“CC品种/亚种：C57BL/6。”
[96]“DINCIT；C21619；小鼠间皮瘤”
[97]“牛NCBI_TaxID=10090；！小家鼠”
[98]“嗨，CVCL_IW90！40”
[99]“SX男”
[100]“AG 1-2M”
[101]“CA癌细胞系”
[102]“DT创建日期：15-05-17；上次更新日期：02-07-20；版本：3”
[103] "//"                                                                                                                                                                                             
[104]“ID#490”
[105]“AC CVCL_B375”
[106]“SY 490；Mab 7；Mab 7”
[107]“CLO博士；CLO_0001018”
[108]“ATCC博士；HB-12029”
[109]“维基数据博士；Q54422073”
[110]“RX专利=US5616470；”
[111]“CC单克隆抗体同型：IgM，kappa。”
[112]“CC单克隆抗体靶点：Cronartium ribicola抗原。”
[113]“牛NCBI_TaxID=10090；！小家鼠”
[114]“嗨，CVCL_4032！P3X63Ag8.653”