Python 从DataFrame/csv中删除空白_Python_Pandas_Beautifulsoup

Python 从DataFrame/csv中删除空白

python pandas

Python 从DataFrame/csv中删除空白,python,pandas,beautifulsoup,Python,Pandas,Beautifulsoup,我想在1个csv中包含2个数据帧 < >我的代码运行并打印2个数据框，但是我想删除列D、E.F行2中的空白，这样行3中的信息就出现在它的头下。数据是正确的，所有的，只是格式是我在这里的问题（如果您运行代码，非常小的文件，这将是有意义的）轮班能解决你的问题吗 import pandas as pd df = pd.DataFrame({"a":[0,1,2,3,4,5], 'b':[10, None, 12, 13, 14, 15], 'c':[20, None, 22

我想在1个csv中包含2个数据帧

< >我的代码运行并打印2个数据框，但是我想删除列D、E.F行2中的空白，这样行3中的信息就出现在它的头下。数据是正确的，所有的，只是格式是我在这里的问题

（如果您运行代码，非常小的文件，这将是有意义的）

轮班能解决你的问题吗

import pandas as pd

df = pd.DataFrame({"a":[0,1,2,3,4,5], 'b':[10, None, 12, 13, 14, 15], 'c':[20, None, 22, 23, 24, 25]})
df.loc[1:,'b':'c']=df.loc[1:,'b':'c'].shift(-1)
print(df)

您可以将

pd.concat

与

axis=1

参数一起使用：

import pandas as pd
from bs4 import BeautifulSoup
import csv
import requests

line1=[]

url='https://clinicaltrials.gov/ct2/show/NCT03548207'
r=requests.get(url)
soup=BeautifulSoup(r.content,'html.parser')
content=soup.find_all('div',id='main-content')
for item in content:
    title=item.find('h1',class_='tr-h1 ct-sans-serif tr-solo_record').text
    sponsor=item.find('div', class_='tr-info-text').text
    summary=item.find('div',class_='ct-body3 tr-indent2').text
    dict={'Title':title,'Sponsor':sponsor,'Summary':summary}
    line1.append(dict)

df=pd.DataFrame(line1)


url2='https://clinicaltrials.gov/ct2/show/NCT03548207'
table1=pd.read_html(url2)[2]
dj=pd.DataFrame(table1)

kk = pd.concat([df, dj], axis=1)  # <--- pd.concat
print(kk)
kk.to_csv('data.csv', index=False)

并保存

data.csv

（来自LibreOffice的屏幕截图）：

请将此设置为MRE。我们不需要打开链接来查看您的数据发生了什么您不需要打开任何链接，代码保存到csv中。但我们仍然需要与url等交互。只需显示df即可。所有漂亮的汤都和你的问题无关。你的问题是我有x df，我想要y dfit没有=-/

import pandas as pd
from bs4 import BeautifulSoup
import csv
import requests

line1=[]

url='https://clinicaltrials.gov/ct2/show/NCT03548207'
r=requests.get(url)
soup=BeautifulSoup(r.content,'html.parser')
content=soup.find_all('div',id='main-content')
for item in content:
    title=item.find('h1',class_='tr-h1 ct-sans-serif tr-solo_record').text
    sponsor=item.find('div', class_='tr-info-text').text
    summary=item.find('div',class_='ct-body3 tr-indent2').text
    dict={'Title':title,'Sponsor':sponsor,'Summary':summary}
    line1.append(dict)

df=pd.DataFrame(line1)


url2='https://clinicaltrials.gov/ct2/show/NCT03548207'
table1=pd.read_html(url2)[2]
dj=pd.DataFrame(table1)

kk = pd.concat([df, dj], axis=1)  # <--- pd.concat
print(kk)
kk.to_csv('data.csv', index=False)

                                               Title  ...             Phase
0  A Study of JNJ-68284528, a Chimeric Antigen Re...  ...  Phase 1  Phase 2

[1 rows x 6 columns]