Python 提取没有类或id的表_Python_Beautifulsoup

Python 提取没有类或id的表

python

Python 提取没有类或id的表,python,beautifulsoup,Python,Beautifulsoup,我正试图从桌子上刮掉一张桌子虽然它看起来相当容易，但我不可能以这样一种方式来识别表，即我可以刮取它，但我无法提取数据。有人能帮你找到正确的身份吗 import urllib3 import urllib.request from bs4 import BeautifulSoup import pandas as pd import requests import csv import re url = 'http://marine-transportation.capitallink.c

我正试图从桌子上刮掉一张桌子

虽然它看起来相当容易，但我不可能以这样一种方式来识别表，即我可以刮取它，但我无法提取数据。有人能帮你找到正确的身份吗

import urllib3 
import urllib.request
from bs4 import BeautifulSoup
import pandas as pd
import requests
import csv
import re


url = 'http://marine-transportation.capitallink.com/indices/baltic_exchange_history.html?ticker=BDI'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
col = row.find_all('td')
column_1 = col[0].string.strip()

#
date = []
closing_rate = []

#Here i need a reference to the correct table
table = soup.find()

for row in table.find_all('tr')[1:]:
    col = row.find_all('td')

    column_1 = col[0].string.strip()
    date.append(column_1)
    column_2 = col[1].string.strip()
    closing_rate.append(column_2)



columns = {'date': date, 'closing_rate': ClosingRate}
df = pd.DataFrame(columns)

df.to_csv('Baltic_Dry.csv')

您可以使用独特的样式属性来标识所需的表

例如，在这个页面上，包含索引数据的表看起来是550px宽的。您可以使用：

soup.findAll（'table'，width=“550”）

请注意：我不得不在同一个网站上使用另一个页面，因为你发布的页面需要登录。希望页面结构类似。

您可以使用独特的样式属性来标识所需的表

例如，在这个页面上，包含索引数据的表看起来是550px宽的。您可以使用：

soup.findAll（'table'，width=“550”）

请注意：我不得不在同一个网站上使用另一个页面，因为你发布的页面需要登录。希望页面结构类似。

页面需要登录页面需要登录