Python 不分析表的所有仅数据头
只是还没有完全理解datetime导入,因为当我解析以获取数据时,我无法获取完整的表数据Python 不分析表的所有仅数据头,python,datetime,beautifulsoup,Python,Datetime,Beautifulsoup,只是还没有完全理解datetime导入,因为当我解析以获取数据时,我无法获取完整的表数据 from datetime import datetime, date, timedelta import requests import re from bs4 import BeautifulSoup base_url = "http://www.harness.org.au/racing/results/?firstDate=" webpage_response = reque
from datetime import datetime, date, timedelta
import requests
import re
from bs4 import BeautifulSoup
base_url = "http://www.harness.org.au/racing/results/?firstDate="
webpage_response = requests.get('http://www.harness.org.au/racing/results/?firstDate=')
soup = BeautifulSoup(webpage_response.content, "html.parser")
format = "%d-%m-%y"
delta = timedelta(days=1)
yesterday = datetime.today() - timedelta(days=1)
yesterday1 = yesterday.strftime(format)
enddate = datetime(2018, 1, 1)
enddate1 = enddate.strftime(format)
while enddate <= yesterday:
enddate += timedelta(days=1)
enddate.strftime(format)
new_url = base_url + str(enddate)
soup12 = requests.get(new_url)
soup1 = BeautifulSoup(soup12.content, "html.parser")
table1 = soup1.find('table', class_='meetingListFull')
for table2 in table1.find('td'):
name = table2.find('a')
从datetime导入datetime、date、timedelta
导入请求
进口稀土
从bs4导入BeautifulSoup
基本url=”http://www.harness.org.au/racing/results/?firstDate="
网页\响应=请求。获取('http://www.harness.org.au/racing/results/?firstDate=')
soup=BeautifulSoup(网页_response.content,“html.parser”)
format=“%d-%m-%y”
增量=时间增量(天数=1)
昨天=datetime.today()-timedelta(天=1)
昨天1=昨天.strftime(格式)
enddate=datetime(2018,1,1)
enddate1=enddate.strftime(格式)
enddate时,您可以为循环尝试以下代码:
表1中tr的查找所有('tr'):
all_cells=tr.find_all('td'))
如果所有_单元:
名称\单元=所有\单元[0]
尝试:
text=name\u cell.a.text.strip()
除:
持续
其他:
打印(文本)
find_all
返回一个iterable列表,因为您只查找名称,所以只需使用第一个单元格
希望这能有所帮助。不,我想重新迭代datelist中的所有名称,最终从所有过去的结果中获取al href和废弃数据。下面是我想从表1中得到的数据,但它没有显示出来。所以,创建href的目的是重复获取过去2年的所有href,重新迭代表格,然后从每个href belowOk获取数据。但这并不明显,因为您的上一句话只是print(name)
。请将您的原始帖子告诉我们,您的期望或目标/目的是什么。具体点。