在python中查找HTML文件中的第一个表_Python_Python 2.7_Html Parsing - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/338.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在python中查找HTML文件中的第一个表_Python_Python 2.7_Html Parsing - Fatal编程技术网

在python中查找HTML文件中的第一个表

python python-2.7

在python中查找HTML文件中的第一个表,python,python-2.7,html-parsing,Python,Python 2.7,Html Parsing,我试图在HTML文件中找到第一个表，并复制表到字符串s f = open('page.html' , 'r') s = "" for line in f.readlines(): line = line.strip() if line.find('<table'): s += line if line.find('</table>'): break print s f=open（'page.html'，'r'） s=“” 对于f.readline

我试图在

HTML

文件中找到第一个

表

，并复制

表

到字符串

f = open('page.html' , 'r')
s = ""
for line in f.readlines():
  line = line.strip()
  if line.find('<table'):
    s += line
  if line.find('</table>'):
    break
print s

f=open（'page.html'，'r'）
s=“”
对于f.readlines（）中的行：
line=line.strip（）
如果line.find（“尝试使用maybe，请参见此SO问题：
如果您必须坚持使用标准库，那么很明显您需要第一个
和最后一个
之间的内容
为此，您需要一个堆栈。从一开始就读取文件。每当遇到
时，推它在堆栈上的位置，每当看到
时，从堆栈中弹出一个。这将确保
与其对应的
匹配
注意最后一个
-如果从堆栈中弹出使其为空，则必须关闭第一个
，因此存储此位置
现在您有了第一个
和最后一个
的位置，因此您可以将它们之间的所有内容复制到一个字符串中。
您可以使用正则表达式进行此操作
import re
tbl_pat = re.compile(r'<table(.*?)>(.*)</table>')
f = open('page.html' , 'r')
for line in f.readlines():
    m = tbl_pat.match(line)
    if m:
        print m.group(2)
        break

重新导入
tbl_pat=re.compile（r'（.*））
f=open（'page.html'，'r'）
对于f.readlines（）中的行：
m=tbl_零件匹配（线）
如果m：
打印m.group（2）
打破
BeautifulSoup
请：@sshashank124:我必须使用标准python库您的第一行。查找缺少一个>在@gurka之后，这不是一个bug，这是一个功能：）它是像
@VeilEclipse这样的标记所需要的解决方案对您有帮助吗？如果有，接受一个怎么样？如果不告诉也。它不会捕获像
这样的标签。我不是第一次得到它。谢谢你指出。




[python 2.7]相关文章推荐



                                                        
Python 2.7 scikit学习多核和伽马值？
python-2.7scikit-learn 
Python 2.7 使用Try:和Finally:删除现有文件并将新输出写入该文件
python-2.7 
Python 2.7 为什么在WindowsVista 64的Python 2.7中安装psycopg2-2.4.6的最后一行出现错误？
python-2.7 
Python 2.7 在画布中逻辑放大/缩小
python-2.7canvastkinter 
Python 2.7 是否有类似于列表的namedtuple？
python-2.7 
Python 2.7 Python嵌套字典键、值交换
python-2.7dictionary 
Python 2.7 google python api中存在无效语法错误
python-2.7 
Python 2.7 如何在odoo中打开和读取外部文本文件？
python-2.7openerp 
Python 2.7 如何使用python选择.csv文件中的每5行
python-2.7csvpython-3.x 
Python 2.7 python的Jupyter字符串标记化
python-2.7csv 
Python 2.7 获取错误“；没有名为mysqldb的模块；尽管mysqldb是使用pip安装的
python-2.7 
Python 2.7 需要帮助用Python完成我的OOP技巧吗
python-2.7oop 
Python 2.7 我想知道如何在python中生成一个平方根，这样当用户键入一个数字时，它会将该数字的平方根提供给用户
python-2.7 
Python 2.7 为什么我无法获得打印的流程？
python-2.7 
Python 2.7 Python：在循环中写入文件读取该文件？
python-2.7for-loopfile-io 
Python 2.7 用Python打印具有特殊格式的列表
python-2.7 
Python 2.7 使用python imagebot时DLL加载失败错误
python-2.7dllscrapy 
Python 2.7 ValueError：只能比较2.7中标签相同的系列对象
python-2.7pandas 
Python 2.7 在scrapy中提取标记值
python-2.7web-scrapingscrapy 
Python 2.7 python从单词列表生成所有组合
python-2.7 
                                       





随机文章推荐



                                                        
Dynamic JRXML中的动态查询字符串
dynamicjasper-reportsreport 
Dynamic 将博客链接到SWF文件的滚动文本中
dynamicflash 
Dynamic 在运行时AS2中创建多个文本字段
dynamic 
Dynamic 动态内容-从哪里开始？
dynamichtml 
Dynamic CWND作为C++中没有DLL或.ocx文件的ActiveX控件？
dynamicmfc 
Dynamic Mathematica动态绘制矩阵数据
dynamicmatrixwolfram-mathematicaplot 
Dynamic Groovy和动态方法：需要Groovy老手的启示吗
dynamicgroovy 
Dynamic 我们可以导出通过静态库提供的函数吗
dynamicdllimport 
Dynamic 动态表中单元格上的UIButton显示错误图像
dynamicuitableviewscroll 
Dynamic knockoutJS动态图表与高图表
dynamicknockout.jshighcharts 
Dynamic joomla：在CMS中维护数据片段以动态化内容
dynamicjoomla 
Dynamic 弱引用游标的表达式类型错误
dynamicplsqloracle10g 
Dynamic 如何在Scheme中获取值的类型？
dynamictypesscheme 
Dynamic 主体的动态大小调整（LibGDX）
dynamiclibgdx 
Dynamic 如何为动态加载的TreeView项目提供EventHandler？
dynamicjavafx 
Dynamic OCaml词汇与动态范围
dynamicocaml 
Dynamic 工作负载计划程序：成功安装动态工作负载控制台后打开TCR管理员面板时出错
dynamic 
Dynamic aem-创建新作者对话框选项卡-单击
dynamictabsaem 
Dynamic 处理BizTalk动态WCF WebHttp端口挂起的消息
dynamicbiztalk 
Dynamic 表格标题显示单个状态或'；美国'；基于滤波器
dynamictableau-api


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Vaadin
Visual Studio 2012
Heroku
Magento2
Openstack
Websocket
Excel Formula
Youtube Api
Matlab
Mips
Akka
Linux
Fortran
Linq To Sql
Primefaces
Verilog
Amazon Web Services
Aframe
Opengl
Cuda
Operating System
Windows Store Apps
Jestjs
Jdbc
Raspberry Pi
Object
Bison
Mfc
Jsf 2
Mdx
Itext
Mpi
C
Linq
Symfony
Logstash
Menu
Vagrant
Sql Server 2008 R2
Autodesk Forge
Dynamics Crm 2011
Coffeescript
Cookies
Git
Angular6
Soap
Django
Sql
Leaflet
Tags
Smalltalk
Web Services
Umbraco
Eclipse Rcp
Sails.js
Pointers
Python
Build
Triggers
Swift3
Jhipster
Ip
Spring Mvc
Antlr4
Gridview
Function
Mule
Navigation
Dynamic
Makefile
Node.js
Unit Testing
Swift2
Binding
Push Notification
Lambda
Geometry
Plsql
Asp.net Web Api
Ssl
Boost
Eclipse
Compression
Gitlab
Xpages
Templates
Gruntjs
Protocol Buffers
Emacs
Kotlin
Checkbox
Time
Imagemagick
Caching
Sorting
Datetime
Pdf
Assembly
Google Analytics
Plugins
Wix
Vim
Xquery
Chef Infra
Sharepoint 2010
Recursion
Visual Studio Code
Serialization
Tcl
Rdf
Wcf
Youtube
Twitter
Acumatica
Windows Mobile
Asp Classic
Arangodb
Perforce
Passwords
Delphi
Oauth
Uitableview
C++ Cli
Prestashop
Ios7
Rest
Prolog
Coldfusion
Ssis
Actionscript 3
Pagination
Project Management
Windows 10
Z3
Amazon Dynamodb
Artifactory
Logging
Jqgrid
File Io
Database
Uwp
Colors
Selenium Webdriver
Apache Pig
Common Lisp
Paypal
Cmd
Gis
Shiny
Amp Html
Discord.js
Spotify
Maven 2
Haskell
Azure Sql Database
Solr
Salesforce
Jasmine
C# 3.0
Openid
Wxpython
Azure Data Factory
Kentico
Scala
Actionscript
Cloud
Plone
Amazon Cloudformation
Monitoring
Datatables
Cakephp
Codeigniter
Windows Services
Doxygen
Kdb
Jquery Plugins
Mercurial
Gmail
Openshift
Exception Handling
Ipad
Android Ndk
Google Maps Api 3
Jsp
Sbt
Search
Kendo Ui
Ibm Mobilefirst
Http
Nunit
Aurelia
Cocoa
Microsoft Graph Api
Map
Clearcase
Rxjs
Xaml
Neo4j
Vmware
Vb6
Sed


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网