Python 使用一个目录中以.ann结尾的所有文件作为Cohen Kappa的y1和y2值

Python 使用一个目录中以.ann结尾的所有文件作为Cohen Kappa的y1和y2值,python,scikit-learn,Python,Scikit Learn,我有两个目录:“ann-1”和“ann-2”,在这些目录中我有文本文件和.ann文件。有没有方法可以使用第一个目录中的所有.ann文件作为y1值,使用第二个目录中的所有.ann文件作为y2值 sklearn.metrics.cohen_kappa_score(y1, y2, *, labels=None, weights=None, sample_weight=None) 我真的不确定我是否正确解释了scikit的文档,因为他们的文档不是很详细。如果您想了解有关.ann文件的更多详细信息,请向

我有两个目录:“ann-1”和“ann-2”,在这些目录中我有文本文件和.ann文件。有没有方法可以使用第一个目录中的所有.ann文件作为y1值,使用第二个目录中的所有.ann文件作为y2值

sklearn.metrics.cohen_kappa_score(y1, y2, *, labels=None, weights=None, sample_weight=None)

我真的不确定我是否正确解释了scikit的文档,因为他们的文档不是很详细。

如果您想了解有关.ann文件的更多详细信息,请向我们展示其中的内容。如果您添加更多详细信息,我将更新答案

现在,为了计算Cohen的Kappa系数,需要将两个相同长度的类似数组的结构传递给函数。第一个数组必须是自变量的观测值,第二个数组必须包含预测标签。下面是一个类似于中的示例:

导入功能 从sklearn.metrics导入cohen_kappa_分数 y1和y2作为列表 y_true=[0,0,0,1] y_pred=[0,0,1,1] 计算系数 k=cohen_kappa_scorey_true,y_pred 为了将ann-1中的.ann文件存储在y1中,将ann-2中的.ann文件存储在y2中,您可以尝试以下方法:您没有显示目录的结构或文件的内容,因此它可能有效,也可能无效,但您可以根据需要调整代码:

导入文件浏览器库 导入操作系统 声明每个目录的路径 路径_1='/路径_到_ann-1/' 路径_2='/路径_到_ann-2/' 每个文件夹中的文件列表 ann_1=os.listdirpath_1 ann_2=os.listdirpath_2 For循环读取文件并计算度量 对于zipann_1、ann_2中的文件_1、文件_2: 检查它们是.ann还是.txt文件 如果文件_1[-4:][='.ann'和文件_2[-4:][='.ann': 根据需要更改分隔符和列 y1=pd.read_csvpath_1+文件_1,sep='|'['target'].值 y2=pd.read_csvpath_2+文件_2,sep='|'['预测'].值 计算度量 m=cohen_kappa_分数1,y2 打印度量 打印文件1'和',文件2'产量',m .ann文件中存储了什么?