Python Pandas-将子字符串从一列复制到另一列
我得到了以下数据帧Python Pandas-将子字符串从一列复制到另一列,python,python-3.x,pandas,Python,Python 3.x,Pandas,我得到了以下数据帧 .tg{边框折叠:折叠;边框间距:0;} .tg td{字体系列:Arial,无衬线;字体大小:14px;填充:10px 5px;边框样式:实心;边框宽度:1px;溢出:隐藏;分词:正常;边框颜色:黑色;} .tg th{字体系列:Arial,无衬线;字体大小:14px;字体大小:正常;填充:10px 5px;边框样式:实心;边框宽度:1px;溢出:隐藏;分词:正常;边框颜色:黑色;} .tg.tg baqh{文本对齐:中心;垂直对齐:顶部} .tg.tg-9hbo{字体
.tg{边框折叠:折叠;边框间距:0;}
.tg td{字体系列:Arial,无衬线;字体大小:14px;填充:10px 5px;边框样式:实心;边框宽度:1px;溢出:隐藏;分词:正常;边框颜色:黑色;}
.tg th{字体系列:Arial,无衬线;字体大小:14px;字体大小:正常;填充:10px 5px;边框样式:实心;边框宽度:1px;溢出:隐藏;分词:正常;边框颜色:黑色;}
.tg.tg baqh{文本对齐:中心;垂直对齐:顶部}
.tg.tg-9hbo{字体大小:粗体;垂直对齐:顶部}
.tg.tg-yw4l{垂直对齐:顶部}
若比德
工作名称
工作链接
不适用
某个工作名称
https://www.particulawebsite.com/jobs-some-job-name.id123465789
不适用
另一个工作名称
https://www.particulawebsite.com/jobs-another-job-name.id987654321
不适用
另一个名字
https://www.particulawebsite.com/jobs-yet-another-job-name.id987321654
希望这有帮助
df['JobID']=df['JobLink'].map(lambda x:x.split('.')[-1])
这将把“JobID”的第一行存储为“id123465789”类似的东西怎么样
df.JobID = df.JobLink.str.extract(r'\.id(.+)$')
输出:
0 JobID JobName JobLink
1 123465789 Some job name https://www.particulawebsite.com/jobs-some-job...
2 987654321 another job name https://www.particulawebsite.com/jobs-another-...
3 987321654 yet another name https://www.particulawebsite.com/jobs-yet-anot...
如果您发布的是实际的数据帧而不是HTML,那么就容易多了。如果你问的是如何将其转换为数据帧,那完全是另一个问题。另外,如果你能分享你已经尝试过的内容和不起作用的内容对不起,我想在其中放一个表,这样更容易理解数据帧的外观。将用代码替换它。太棒了,非常感谢。我用的提取方法全错了。