Reference sckikit学习数据集的来源

Reference sckikit学习数据集的来源,reference,scikit-learn,dataset,Reference,Scikit Learn,Dataset,我的一个学生正在使用scikit学习包中的糖尿病数据集来熟悉机器学习。她需要就此写一份报告,并向我询问这些数据最初来自何处。我们发现的唯一来源并没有说明可能产生这些数据的原始出版物或队列研究。有人知道这些数据来自哪里吗 我们发现的参考文献: (表1) [编辑]这篇论文在文献中被引用为参考文献,但它不包括任何关于谁对数据集(原始科学出版物)取样的信息,也不包括来自哪个国家的队列。没有实质性的迹象表明这些数据不是虚构的。这些数据是来自真实患者还是完全是人工数据集?学习如何将机器学习与scikit学

我的一个学生正在使用scikit学习包中的糖尿病数据集来熟悉机器学习。她需要就此写一份报告,并向我询问这些数据最初来自何处。我们发现的唯一来源并没有说明可能产生这些数据的原始出版物或队列研究。有人知道这些数据来自哪里吗

我们发现的参考文献:

  • (表1) [编辑]这篇论文在文献中被引用为参考文献,但它不包括任何关于谁对数据集(原始科学出版物)取样的信息,也不包括来自哪个国家的队列。没有实质性的迹象表明这些数据不是虚构的。这些数据是来自真实患者还是完全是人工数据集?学习如何将机器学习与scikit学习结合使用是一件好事,但不知道培训集来自何处却令人沮丧

  • 根据

    源URL:


    也许我能帮上忙。但是这个问题对于Stackoverflow来说是离题的。谢谢,事实上我也发现了这个问题,他们给出的唯一参考是“来自布拉德利·埃夫隆、特雷弗·黑斯蒂、伊恩·约翰斯通和罗伯特·蒂布什拉尼(2004年)”,最小角度回归,“统计年鉴”,这已经包含在我的原始帖子中。我们读了那篇文章,但它没有告诉我们谁对数据集(原始科学出版物)进行了抽样,哪个队列来自哪个国家,没有实质性的迹象表明这些数据不是虚构的。这些数据是来自真实患者还是完全是人工数据集?