Python 我想使用for循环从文本类型的网站中提取某个段落

Python 我想使用for循环从文本类型的网站中提取某个段落,python,python-3.6,text-extraction,Python,Python 3.6,Text Extraction,网站= 我想从使用for循环的给定链接中,以python文本格式提取名为“管理层对财务状况和运营结果的讨论和分析”的段落。您可以使用python urllib2库来完成此操作 python代码示例: import urllib2 data = urllib2.urlopen("https://wordpress.org/plugins/about/readme.txt") # read file data = data.split("\n") # then split it into lin

网站=


我想从使用for循环的给定链接中,以python文本格式提取名为“管理层对财务状况和运营结果的讨论和分析”的段落。

您可以使用python urllib2库来完成此操作

python代码示例:

import urllib2

data = urllib2.urlopen("https://wordpress.org/plugins/about/readme.txt")  # read file
data = data.split("\n") # then split it into lines

for line in data:
    if line = "MANAGEMENT'S DISCUSSION AND ANALYSIS OF FINANCIAL CONDITION AND RESULTS OF OPERATIONS"
    print line # or what you want to do

您编写了什么代码来实现这一点,以及您到底被困在了什么地方?另请参见(tl;dr:never)从EDGAR文件中提取特定项目的问题已被频繁讨论。搜索问答-但你应该知道:这很难。我想在这个链接中找到整个段落,即从第14页到第19页。但在一般格式中,如何在.txt文件中删除页面?一定有计价器