Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/359.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何从web上删除元素以获取数据?_Python_Html_Web Scraping_Beautifulsoup - Fatal编程技术网

Python 如何从web上删除元素以获取数据?

Python 如何从web上删除元素以获取数据?,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,我使用Beautifulsoup和soup.findAll来获取相关信息,但我想删除1个值(介于…),其标记为。 我该怎么做?Python 2.7 . . . soup = BeautifulSoup(x, 'lxml') tab6col = soup.findAll('table', { "class" : "tab6col" }) 下面是我的html代码: [\n\xa02015.\xe9v2014.\xe9v2013.\xe9v2012.\xe9v2011.\xe9vBesz\xe

我使用Beautifulsoup和soup.findAll来获取相关信息,但我想删除1个值(介于
),其
标记为。 我该怎么做?Python 2.7

.
.
.

soup = BeautifulSoup(x, 'lxml')

tab6col = soup.findAll('table', { "class" : "tab6col" })
下面是我的html代码:

[\n\xa02015.\xe9v2014.\xe9v2013.\xe9v2012.\xe9v2011.\xe9vBesz\xe1mol\xe1si id\xf5szak2015.01.01.-2015.12.31.2014.01.01.-2014.12.31.2013.12.30.-2013.12.31.Nincs adat.\xa0eftefteftefteftefteft\xc9rt\xe9kes\xedt\xe9s nett\xf3\xe1rbev\xe9s nett\xe9s nett\xf3\xe1rbev\xe9telenics adat.Nincs adat.Nincs adat.Nincs adat.bet.Bev\xev\xe.Bev\xe9tex\xe9tex\xe9tex\xe9tex55Nincs adat.Nincs adat.Ad\xf3z\xe1s el\xf5tti eredm\xe9ny-192 778-169 4761 755Nincs adat.M\xe9rleg Szeriti eredm\xe9ny-124 09901 421Nincs adat.Ad\xf3zott eredm\xe9ny-192 778-169 4761 579Nincs adat.Nincs adat.Eszk\xf6k\xf6sszesen37 820 88140 695 236 992 Nincs adat525 06316 925 711 Nincs adat.Nincs adat.Forg\xf3eszk\xf6z\xf6k19 008 58721877 27519 792 420Nincs adat.Nincs adat.P\xe9nzeszk\xf6z\xf6k947 0151 056 1011 307 Nincs adat.Akt\xedv id\xf5beli elhat\xe1rol\xe1sok143 468293 504273 960Nincs adat.Saj\xe1t\xe1t\xe2 141\xe1t\xf1t35359 Nincs adat.Nincs adat656148 65218 960 Nincs adat.Nincs adat.K\xF6elezets\xe9gek35 541 53138 059 39934 233 518Nincs adat.R\xf6vid lej\xe1rat\xfa K\xF6elezets\xe9gek30 519 49130 426 01426 394 088Nincs adat.Nincs adat.Hossz\xfa lej\xe1rat\xfa\xfa K\xF6elezets\xe9gek5 022 0407 633 3857 839\xel108 Nincs adat375303 712386 059Nincs adat.Nincs adat.P\xe9nz\xfcgyi mutat\xf3elad\xf3sodotts\xe1g foka-iNincs adat.Nincs adat.Elad\xf3sodotts\xe1g m\xe9rt\xe9ke-Bonit\xe1s-iNincs adat.Nincs adat\xc1rbev\xe9tel\xezkar\xe1nyos eredm\xe9ny%iNincs adat.Nincs adat.Nincs adat.likevidit\xe\xe\xe1si\xe\xe\xe1si gyorsr\xe\xe\xe\xe1t\xe1t\xe\xe\xe\xe\xe\xe\xe\xe\xe\xer\xe1nyos-nyeres\xe9g i-0010000,00Bev\xe9telar\xe1nyos-eredm\xe9ny i-0,07-0050,17Saj\xe1t\xf5ke-ar\xe1nyos-nyeres\xe9g i-0,09-0080,00L\xe9tsz\xe1m:\xa0 136 f\xf5\n]
您需要的是。找到
td
标签并使用
deompose()

soup = BeautifulSoup(x, "lxml")
tab6col = soup.find("table", { "class" : "tab6col" })
td = tab6col.find("tr", text="P\xe9nz\xfcgyi mutat\xf3k")
td.decompose()
编辑

试试这个

import urllib2
import unicodecsv as csv
import os
import sys
import io
import time
import datetime
import pandas as pd
from bs4 import BeautifulSoup
import MySQLdb

filename=r'output.csv'

resultcsv=open(filename,"wb")
output=csv.writer(resultcsv, delimiter=';',quotechar = '"', quoting=csv.QUOTE_NONNUMERIC, encoding='latin-1')

f = open('opten2.txt', 'r')
x = f.read()
f.close()

soup = BeautifulSoup(x, 'lxml') 
tab6col = soup.find('table', { "class" : "tab6col" }) 

datatable=[]
for record in tab6col.find_all('tr'):
    temp_data = []
    for data in record.find_all('td'):
        temp_data.append(data.text.encode('latin-1'))
    datatable.append(temp_data)

output.writerows(datatable)

resultcsv.close()

对不起,你到底想删除什么?表?显示示例或说输入和所需输出我使用bsoup获得一个表,我想删除这个TR之间的一个值。我更新我的问题,插入完整的html代码,这更容易理解。所以我必须使用它?`td=tab6col.find(“P\xe9nz\xfcgyi mutat\xf3k”,align=False)td.decompose()`@tardos93不,不是那样。你想删除所有没有align属性的
td
标记吗?当然不想。我也只想删除这个带有他的td标记的数据。AttributeError:ResultSet对象没有属性“find”。你可能把项目列表当作单个项目。你调用了find_all()吗当你打算调用find()时?啊,我完全迷路了。它不工作,+我也想用标签删除。你能检查一下我要更改的内容吗?