R中的性别检测
有没有一种方法可以从R中的欧洲名字列表中进行性别检测。 提前谢谢 例如,我有一份姓氏夫妇的名单:R中的性别检测,r,algorithm,detection,R,Algorithm,Detection,有没有一种方法可以从R中的欧洲名字列表中进行性别检测。 提前谢谢 例如,我有一份姓氏夫妇的名单: namesurname<-c("Hassan Al-Khayr", "Flores Juberías Carlos" ,"Géza Lévai" , "Miklós Lipták" , "László Péter" , &qu
namesurname<-c("Hassan Al-Khayr", "Flores Juberías Carlos" ,"Géza Lévai" , "Miklós Lipták" , "László Péter" , "László Váradi" , "Sándor Molnár" ,
"Csaba Attila Nemes" , "Zoltán Károly" , "István Bajza" )
nameurname如果您有所有名字及其对应性别的列表,则可以生成一个对象。获取性别就像将名字传递到散列中一样简单。一个限制是这实际上并没有告诉你他们的性别,这只是一个猜测。这个{genderizeR}
包封装了对genderizeR.io的API的调用。
Genderizer.io从文本字符串中估算姓氏,并将其与从大量社交媒体元数据中获得的性别值相关联,因此它对于当前的命名约定非常可靠
library(tidyverse)
library(genderizeR)
namesurname<-c("Hassan Al-Khayr", "Flores Juberías Carlos","Géza Lévai", "Miklós Lipták", "László Péter" ,"László Váradi" , "Sándor Molnár", "Csaba Attila Nemes", "Zoltán Károly", "István Bajza")
df_gender <- findGivenNames(x = namesurname, textPrepare = TRUE)
genderize(x = namesurname, genderDB = df_gender)
text givenName gender genderIndicators
1: Hassan Al-Khayr hassan male 3
2: Flores Juberías Carlos carlos male 2
3: Géza Lévai <NA> <NA> 0
4: Miklós Lipták miklós male 1
5: László Péter lászló male 2
6: László Váradi lászló male 1
7: Sándor Molnár molnár male 2
8: Csaba Attila Nemes attila male 3
9: Zoltán Károly zoltán male 2
10: István Bajza istván male 2
库(tidyverse)
图书馆(genderizeR)
我想到的第一个问题是确定vs的性别。