Python 如何使用pandas(每个类别在单独的列中)来检索这些文本数据?

Python 如何使用pandas(每个类别在单独的列中)来检索这些文本数据?,python,pandas,database,dataframe,statistics,Python,Pandas,Database,Dataframe,Statistics,我需要将auth_name、univ、department放在df的以下文本数据列中: 输出df.head(): 认证名称 大学 部门 0 巴希里,法赫德A。;哈马德,穆达提尔H。;肯塔布,阿马尔·Y。;萨利赫,穆斯塔法A。;纳赛尔,穆罕默德N。 沙特国王大学 沙特阿拉伯利雅得诺尔区沙特国王大学医学城哈立德国王大学医院 1. 哈马德,穆达提尔H。;艾默尔,亚西尔S。;Abouelkheir,Manal M。;穆罕默德·萨拉尔;艾哈迈迪,塔哈尼;伊克巴尔,谢赫M。 沙特国王大学 沙特利雅得沙特国

我需要将auth_name、univ、department放在df的以下文本数据列中:

输出
df.head()

认证名称 大学 部门 0 巴希里,法赫德A。;哈马德,穆达提尔H。;肯塔布,阿马尔·Y。;萨利赫,穆斯塔法A。;纳赛尔,穆罕默德N。 沙特国王大学 沙特阿拉伯利雅得诺尔区沙特国王大学医学城哈立德国王大学医院 1. 哈马德,穆达提尔H。;艾默尔,亚西尔S。;Abouelkheir,Manal M。;穆罕默德·萨拉尔;艾哈迈迪,塔哈尼;伊克巴尔,谢赫M。 沙特国王大学 沙特利雅得沙特国王大学医学城哈立德国王大学医院儿科CPGs部 2. 艾曼艾亚迪。 沙特国王大学 沙特阿拉伯利雅得沙特国王大学医疗城哈立德国王大学医院儿科护理部 3. 艾哈迈迪,塔哈尼 沙特国王大学 沙特阿拉伯利雅得沙特国王大学医学城哈立德国王大学医院 4. 阿涅姆里,阿卜杜拉赫曼M。 沙特国王大学 沙特利雅得国王哈立德大学医学城新生儿科部哈立德国王大学医院
你本可以更好地解释这个问题。这是一个列,包含科学出版和参与部门的名称,我试图从该列中提取所有部门,以找出出版中参与最多的部门,但我很难通过搜索df['col']中的colunmif数据来获得这些部门这段代码是怎么写的?我尝试了一下,但它是git错误,因为AttributeError:“Series”对象没有属性“split”。我的代码假设输入数据是文本字符串。你是说你是从一个数据帧中得到的吗?那么数据帧是如何构造的?你想解析什么?这是一个列,包含科学出版和参与部门的名称,我试图从该列中提取所有部门,以找出出版中参与最多的部门,假设所有出版物都位于列
df['col']
的不同单元格中,您可以尝试以下操作:
df[['auth_name','univ','department']]]=df['col'].apply(lambda x:pd.Series([[i.split(']')[0],i.split(']])[1]。split('','1])[1]。split('','1','1][1]]用于i-in-x[1:][split split 0]
“TypeError:'float'对象不可订阅”它给出了此错误
import pandas as pd

data =  '[Bashiri, Fahad A.; Hamad, Muddathir H.; Kentab, Amal Y.; Salih, Mustafa A.; Al Nasser, Mohammad N.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Div Neurol, Riyadh, Saudi Arabia; [Hamad, Muddathir H.; Amer, Yasser S.; Abouelkheir, Manal M.; Mohamed, Sarar; Al-Ahmadi, Tahani; Iqbal, Shaikh M.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Pediat CPGs Dept Comm, Riyadh, Saudi Arabia; [Al-Eyadhy, Ayman A.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Pediat Intens Care Unit, Riyadh, Saudi Arabia; [Al-Ahmadi, Tahani] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Div Gen Pediat, Riyadh, Saudi Arabia; [Alnemri, Abdulrahman M.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Div Neonatol,Dept Pediat, Riyadh, Saudi Arabia; [Al Othman, Mohammed A.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Pediat Emergency Unit,Emergency Med Dept, Riyadh, Saudi Arabia; [Somily, Ali M.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Dept Pathol & Lab Med,Microbiol Unit, Riyadh, Saudi Arabia; [Al-Ansary, Lubna A.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Dept Family Community Med,Coll Med, Riyadh, Saudi Arabia; [Amer, Yasser S.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Qual Management Dept, Riyadh, Saudi Arabia; [Amer, Yasser S.; Abouelkheir, Manal M.; Iqbal, Shaikh M.; Wahabi, Hayfaa A.; Al-Ansary, Lubna A.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Clin Practice Guidelines Steering Comm, Riyadh, Saudi Arabia; [Amer, Yasser S.; Wahabi, Hayfaa A.; Al-Ansary, Lubna A.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Res Chair Evidence Based Hlth Care & Knowledge Tr, Riyadh, Saudi Arabia; [Abouelkheir, Manal M.] King Saud Univ, King Khalid Univ Hosp, King Saud Univ Med City, Pediat Clin Pharm Serv, Riyadh, Saudi Arabia; [Bashiri, Fahad A.; Kentab, Amal Y.; Salih, Mustafa A.; Hundallah, Khalid J.; Alwadei, Ali H.; Albaradie, Raidah S.; Al-Twaijri, Waleed A.; Jan, Mohammed M.] Prince Sultan Mil Med City, Dept Pediat, Saudi Pediat Neurol Soc, Riyadh, Saudi Arabia; [Mohamed, Sarar] Prince Sultan Mil Med City, Dept Pediat, Genet Metab Div, Riyadh, Saudi Arabia; [Hundallah, Khalid J.] Prince Sultan Mil Med City, Dept Pediat, Pediat Neurol, Riyadh, Saudi Arabia; [Wahabi, Hayfaa A.] King Fahad Med City, Natl Neurosci Inst, Pediat Neurol Dept, Riyadh, Saudi Arabia; [Al-Twaijri, Waleed A.] Natl Guard King Saud bin Abdulaziz Univ, King Abdullah Specialist Children Hosp, Riyadh, Saudi Arabia; [Al-Otaibi, Faisal] King Faisal Specialist Hosp & Res Ctr, Dept Neurosci, Riyadh, Saudi Arabia; [Al-Otaibi, Faisal] Saudi Epilepsy Soc, Gulf League Epilepsy, Riyadh, Saudi Arabia; [Albaradie, Raidah S.; Jan, Mohammed M.; Alnemri, Abdulrahman M.] Saudi Epilepsy Soc, Riyadh, Saudi Arabia; [Albaradie, Raidah S.] King Fahad Specialist Hosp, Dept Pediat Neurol, Dammam, Saudi Arabia; [Jan, Mohammed M.] King Abdulaziz Univ, Fac Med, Dept Pediat, Jeddah, Saudi Arabia; [Iqbal, Shaikh M.] Univ Manitoba, Dept Pediat & Child Hlth, Sect Respirol, Winnipeg, MB, Canada; [Bashiri, Fahad A.] King Saud Univ, King Khalid Univ Hosp, Coll Med, Dept Pediat, Riyadh, Saudi Arabia'
data_list = [[i.split('] ')[0], i.split('] ')[1].split(', ', 1)[0], i.split('] ')[1].split(', ', 1)[1]] for i in data[1:].split('; [')]
df = pd.DataFrame(data_list, columns=['auth_name','univ','department'])
def get_depart(df,col):
    x = []
    for i in range(len(df)):
        y= re.findall(r'(?i)((?:\w+\s)?{0}(?:\s\w+)?)'.format('Dept'), df[col][i])
        #print(y,len(y))
        x.append(y)
    return(x)
out counts 
[Dept Chem]                                     4300 
[Dept Bot]                                      2459 
[Dept Zool]                                     2206 
[Dept Pharmaceut]                               2058 
[Dept Phys]                                     1616 
[Dept Math]                                     1431 
[DeptBiochem]                                   690 
[Dept Food]                                     687 
[Dept Pharmacognosy]                            670