Python 3.x 从数据帧列中剥离字符
我正在尝试只获取团队名称,并删除在我刮表时附加的团队记录。我知道我可以使用rstrip(),但我不想输入所有要删除的团队记录。有什么想法吗Python 3.x 从数据帧列中剥离字符,python-3.x,pandas,Python 3.x,Pandas,我正在尝试只获取团队名称,并删除在我刮表时附加的团队记录。我知道我可以使用rstrip(),但我不想输入所有要删除的团队记录。有什么想法吗 # Using Pandas to extract rankings tables import pandas as pd tables = pd.read_html(base_site) # base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranki
# Using Pandas to extract rankings tables
import pandas as pd
tables = pd.read_html(base_site)
# base_site = "http://cbssports.com/college-football/rankings/cbs-sports-ranking/"
rankings=tables[0]
rankings
rankings.drop(['Trend', 'Next Game', 'Unnamed: 5', 'Unnamed: 3'], axis=1)
从中我得到:
Rank Team
0 1 LSU 15-0
1 2 Clemson 14-1
2 3 Ohio St. 13-1
3 4 Georgia 12-2
4 5 Oregon 12-2
... ... ...
125 126 New Mexico St. 2-10
126 127 Old Dominion 1-11
127 128 UTEP 1-11
128 129 Massachusetts 1-11
129 130 Akron 0-12
130行×2列
正在从“团队”列中删除团队的记录。想法?你可以做
rsplit
df['Team']=df['Team'].str.rsplit(' ', n=1).str[0]
但我不想输入所有要删除的团队记录。有什么想法吗?不理解这一点…抱歉,我的意思是我需要指定要剥离的字符或字符串,这将是团队记录:。你能解释一下n=1.strip(0)的作用吗?Thanks@DJFrsplit,从右边拆分字符串,只拆分第一个空格,我们得到第一部分