试图找到用python删除或显示类似引用的方法
我有个问题需要你的帮助。 我有一个word文件,其中包含许多参考资料,如: [1] 韩美华、李玉华和黄春华,“纳米MOSFET器件和电路中固有参数波动引起的高频特性的影响”,微电子可靠性,第50卷,第657-6612010页 [2] E.Maricau和G.Gielen,“纳米CMOS可靠性的计算机辅助模拟电路设计”,电路和系统中的新兴和选定主题,IEEE期刊,第1卷,第50-58页,2011年。 . . 可能这些参考文献中的一些相似,但它们的编号不同。 你有没有办法用#python删除或显示类似的引用?试图找到用python删除或显示类似引用的方法,python,text,ms-word,Python,Text,Ms Word,我有个问题需要你的帮助。 我有一个word文件,其中包含许多参考资料,如: [1] 韩美华、李玉华和黄春华,“纳米MOSFET器件和电路中固有参数波动引起的高频特性的影响”,微电子可靠性,第50卷,第657-6612010页 [2] E.Maricau和G.Gielen,“纳米CMOS可靠性的计算机辅助模拟电路设计”,电路和系统中的新兴和选定主题,IEEE期刊,第1卷,第50-58页,2011年。 . . 可能这些参考文献中的一些相似,但它们的编号不同。 你有没有办法用#python删除或显示
谢谢您可以将脚注文本拆分为一个数字和参考的其余部分:
>>> footnote = '[1] P. Wood, "Example Thesis," Some collection, pp 45-46, 2018'
>>> number, reference = footnote.split(' ', 1)
>>> reference
'P. Wood, "Example Thesis," Some collection, pp 45-46, 2018'
Python有一个用于构建直方图的类
您可以将引用添加到计数器
对象,然后在存在多个对象时查询该对象:
>>> from collections import Counter
>>> counter = Counter()
>>> counter[reference] += 1
您可以创建所有脚注的循环:
>>> for footnote in footnotes:
... number, reference = footnote.split(' ', 1)
... counter[reference] += 1
然后访问大于1
的计数:
>>> duplicates = [item for item, count in counter.most_common()
... if count > 1]
欢迎访问stackoverflow.com。请学习如何创建。您如何定义“相似”?这些参考资料相似吗?如果不是,你能举个例子,并解释为什么它们是相似的吗?请在提问前检查