Python 从DataFrame/csv中删除空白
我想在1个csv中包含2个数据帧 < >我的代码运行并打印2个数据框,但是我想删除列D、E.F行2中的空白,这样行3中的信息就出现在它的头下。 数据是正确的,所有的,只是格式是我在这里的问题 (如果您运行代码,非常小的文件,这将是有意义的)Python 从DataFrame/csv中删除空白,python,pandas,beautifulsoup,Python,Pandas,Beautifulsoup,我想在1个csv中包含2个数据帧 < >我的代码运行并打印2个数据框,但是我想删除列D、E.F行2中的空白,这样行3中的信息就出现在它的头下。 数据是正确的,所有的,只是格式是我在这里的问题 (如果您运行代码,非常小的文件,这将是有意义的) 轮班能解决你的问题吗 import pandas as pd df = pd.DataFrame({"a":[0,1,2,3,4,5], 'b':[10, None, 12, 13, 14, 15], 'c':[20, None, 22
轮班能解决你的问题吗
import pandas as pd
df = pd.DataFrame({"a":[0,1,2,3,4,5], 'b':[10, None, 12, 13, 14, 15], 'c':[20, None, 22, 23, 24, 25]})
df.loc[1:,'b':'c']=df.loc[1:,'b':'c'].shift(-1)
print(df)
您可以将
pd.concat
与axis=1
参数一起使用:
import pandas as pd
from bs4 import BeautifulSoup
import csv
import requests
line1=[]
url='https://clinicaltrials.gov/ct2/show/NCT03548207'
r=requests.get(url)
soup=BeautifulSoup(r.content,'html.parser')
content=soup.find_all('div',id='main-content')
for item in content:
title=item.find('h1',class_='tr-h1 ct-sans-serif tr-solo_record').text
sponsor=item.find('div', class_='tr-info-text').text
summary=item.find('div',class_='ct-body3 tr-indent2').text
dict={'Title':title,'Sponsor':sponsor,'Summary':summary}
line1.append(dict)
df=pd.DataFrame(line1)
url2='https://clinicaltrials.gov/ct2/show/NCT03548207'
table1=pd.read_html(url2)[2]
dj=pd.DataFrame(table1)
kk = pd.concat([df, dj], axis=1) # <--- pd.concat
print(kk)
kk.to_csv('data.csv', index=False)
并保存data.csv
(来自LibreOffice的屏幕截图):
请将此设置为MRE。我们不需要打开链接来查看您的数据发生了什么您不需要打开任何链接,代码保存到csv中。但我们仍然需要与url等交互。只需显示df即可。所有漂亮的汤都和你的问题无关。你的问题是我有x df,我想要y dfit没有=-/
import pandas as pd
from bs4 import BeautifulSoup
import csv
import requests
line1=[]
url='https://clinicaltrials.gov/ct2/show/NCT03548207'
r=requests.get(url)
soup=BeautifulSoup(r.content,'html.parser')
content=soup.find_all('div',id='main-content')
for item in content:
title=item.find('h1',class_='tr-h1 ct-sans-serif tr-solo_record').text
sponsor=item.find('div', class_='tr-info-text').text
summary=item.find('div',class_='ct-body3 tr-indent2').text
dict={'Title':title,'Sponsor':sponsor,'Summary':summary}
line1.append(dict)
df=pd.DataFrame(line1)
url2='https://clinicaltrials.gov/ct2/show/NCT03548207'
table1=pd.read_html(url2)[2]
dj=pd.DataFrame(table1)
kk = pd.concat([df, dj], axis=1) # <--- pd.concat
print(kk)
kk.to_csv('data.csv', index=False)
Title ... Phase
0 A Study of JNJ-68284528, a Chimeric Antigen Re... ... Phase 1 Phase 2
[1 rows x 6 columns]