Python 如何使用ChemDataExtractor提取化学实体?
我正试图通过ChemDataExtractor(Python)处理一个用于提取化学实体的文本。一个可能的例子是Python 如何使用ChemDataExtractor提取化学实体?,python,nlp,Python,Nlp,我正试图通过ChemDataExtractor(Python)处理一个用于提取化学实体的文本。一个可能的例子是 from chemdataextractor import Document doc = Document('UV-vis spectrum of 5,10,15,20-Tetra(4-carboxyphenyl)porphyrin in Tetrahydrofuran (THF).') 然后键入doc.cems结果如下 [Span('THF', 82, 85), Span('5,
from chemdataextractor import Document
doc = Document('UV-vis spectrum of 5,10,15,20-Tetra(4-carboxyphenyl)porphyrin in Tetrahydrofuran (THF).')
然后键入doc.cems
结果如下
[Span('THF', 82, 85),
Span('5,10,15,20-Tetra(4-carboxyphenyl)porphyrin', 19, 61),
Span('Tetrahydrofuran', 65, 80)]
我只想提取'THF'
,'5,10,15,20-四(4-羧基苯基)卟啉'
,'四氢呋喃'
,而不提取“span元素”。我该怎么做?解决方案是:
doc.cems[0].text
doc.cems[1].text
doc.cems[2].text