Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/google-sheets/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Deep learning 在进行深度学习时,我可以使用不同来源的数据集吗_Deep Learning_Dataset_Distribution - Fatal编程技术网

Deep learning 在进行深度学习时,我可以使用不同来源的数据集吗

Deep learning 在进行深度学习时,我可以使用不同来源的数据集吗,deep-learning,dataset,distribution,Deep Learning,Dataset,Distribution,简单地说,我想利用胸部X光图像检测患者是否患有肺癌 我在这里面临的问题是: 我有来自3个不同来源的3个数据集,其中3个主题都是胸部X光图像,假设所有其他医学特性也相同。 第一个数据集包含130张正常和癌症诊断患者的图像。 第二个数据集包含40幅正常患者的图像 第三个数据集包含120张癌症患者的图像 因此,我想结合来自3个不同来源的3个数据集来训练和评估我的模型。 我打算混合和洗牌所有数据,然后开始分裂成训练,验证,测试集。可以吗 还有什么我应该注意的吗?据我所知,通常混合数据集不是一件好事,尤其

简单地说,我想利用胸部X光图像检测患者是否患有肺癌

我在这里面临的问题是: 我有来自3个不同来源的3个数据集,其中3个主题都是胸部X光图像,假设所有其他医学特性也相同。 第一个数据集包含130张正常和癌症诊断患者的图像。 第二个数据集包含40幅正常患者的图像 第三个数据集包含120张癌症患者的图像

因此,我想结合来自3个不同来源的3个数据集来训练和评估我的模型。 我打算混合和洗牌所有数据,然后开始分裂成训练,验证,测试集。可以吗


还有什么我应该注意的吗?

据我所知,通常混合数据集不是一件好事,尤其是当数据集彼此不太相似时。然而,在你的案例中,你说所有这些都是人类肺部的X光图像。我们希望所有的图像都非常相似,所以混合它们不会对性能造成不良影响,但我想这是一种好的方式

在深度学习领域,拥有大量数据总是一件好事。特别是大型神经网络需要大量的数据。你的数据对我来说似乎不那么重要。我建议你使用简单的网络

简言之,所有合并的图像是否可能来自同一来源?i、 它们大体上相似,但只在感染部位不同?如果是的话,那就去吧


祝你好运

据我所知,通常情况下混合数据集不是一件好事,尤其是当数据集彼此不太相似时。然而,在你的案例中,你说所有这些都是人类肺部的X光图像。我们希望所有的图像都非常相似,所以混合它们不会对性能造成不良影响,但我想这是一种好的方式

在深度学习领域,拥有大量数据总是一件好事。特别是大型神经网络需要大量的数据。你的数据对我来说似乎不那么重要。我建议你使用简单的网络

简言之,所有合并的图像是否可能来自同一来源?i、 它们大体上相似,但只在感染部位不同?如果是的话,那就去吧


祝你好运

谢谢你的评论,一般来说,它们在病变的形状和区域上是不同的。但在正常情况下,情况是一样的。然而,我还有一个问题,它在我的数据集中的“分布”是什么意思,它是正常和癌症等级的比率吗?@totalynew你能给出整个句子和上下文吗?但是,是的,例如,我想同源分布意味着你有相似数量的类。我只是想知道,对于一个只包含正常和癌症患者图像的数据集,数据集的分布是什么。这个分布是否意味着癌症和正常之间的比例class@TotallyNew对这意味着有多少图像是癌变图像,有多少是正常图像。谢谢你的评论,总的来说,它们在形状和病变区域上是不同的。但在正常情况下,情况是一样的。然而,我还有一个问题,它在我的数据集中的“分布”是什么意思,它是正常和癌症等级的比率吗?@totalynew你能给出整个句子和上下文吗?但是,是的,例如,我想同源分布意味着你有相似数量的类。我只是想知道,对于一个只包含正常和癌症患者图像的数据集,数据集的分布是什么。这个分布是否意味着癌症和正常之间的比例class@TotallyNew对这意味着有多少图像是癌症图像,有多少是正常图像。