Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/jquery-ui/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
 Deep Learning_IT技术博客_编程技术问答 - 「Fatal编程技术网」

Deep learning 没有卷积的DenseNet?

最近的论文《密集连接卷积网络》表明,他们的DenseNet深度学习体系结构优于最先进的ResNet体系结构。对于类似的架构,是否有类似的论文/存储库,但没有卷积(RNN/只是密集)?否 简单的答案是卷积本身允许通过利用大多数图像中真实的数据局部性进行正则化。这也是实现更深层网络的关键,这对于更深层的表达至关重要 另一个关键原因是,一个只有输入大小(通常为224*224)的密集层会占用大部分GPU内存,因此现在几乎没有机会为这种大小或超过几层的图像实现密集网络。也许如果你有10倍的GPU内存,你可

Deep learning 连接层在caffe中真的产生4D输出吗?

我在这里阅读了有关concatation层的文档:。它说: 输入: n_i*c_i*h*w用于从1到K的每个输入blob i 输出: 如果轴=0:n_1+n_2+…+n_K*c_1*h*w和所有输入c_i 应该是一样的 如果轴=1:n_1*c_1+c_2+…+c_K*h*w,所有输入n_i应相同 然而,我很难想象,当所有图层都接受3D输入时,怎么会有4维输出?是否有某种技巧可以将4D输出读取为3D输出?实际上输入和输出都有4D:批次尺寸、通道数、高度和宽度。在特殊情况下,您可以获得不同数量的尺寸

Deep learning 在Keras中,批量大小与时代之间的关系是什么?

我正在训练一个有8000个样本的模型 classifier = KerasClassifier(build_fn=build_classifier, batch_size=10, nb_epoch=100) 如果批次大小为10(则每个批次将包含800个样本)。因此,在每个时代,这800个样本中的一个将用于拟合模型。这就是我所理解的,如果我错了,请纠正我 输出是 纪元1/10 10/7200 [..............................] - ETA: 2:57 - loss:

Deep learning 为什么成本函数和最后一个激活函数在MXNet中绑定?

在定义深度学习模型时,我们执行以下步骤: 指定如何基于输入和模型参数计算输出 指定成本(损失)函数 通过最小化成本函数来搜索模型参数 在我看来,在MXNet中,前两个步骤是绑定的。例如,我用以下方式定义线性变换: # declare a symbolic variable for the model's input inp = mx.sym.Variable(name = 'inp') # define how output should be determined by the input o

Deep learning 关于视网膜神经的困惑

我最近一直在学习视网膜网。我读了原稿和一些相关的文章,并写了一篇分享我所学到的东西的帖子:。然而,我仍然有一些困惑,我在帖子中也指出了这一点。谁能给我点化一下吗 混乱#1 如本文所示,如果具有任何地面真实值的IoU低于0.4,则将锚定框分配给背景。在这种情况下,对应的分类目标标签应该是什么(假设有K个类) 我知道SSD有一个背景类(总的来说是K+1类),而YOLO预测一个置信度得分,除了K类概率外,还指示盒子中是否有对象(不是背景)或没有对象(背景)。虽然我在论文中没有发现任何声明表明Retin

Deep learning 属性错误:模块';普通';没有属性';分配缓冲区';

错误:属性错误:模块“common”没有属性“allocate\u buffers” 什么时候发生:我有一个yolov3.onnx模型,我正在尝试使用TensorRT,以便使用trt引擎对模型进行推理。使用pip install common安装common模块后(也尝试了pip3 install common),我收到一个错误:在这一行:输入、输出、绑定、流=common。分配缓冲区(引擎) 编辑:我刚刚意识到,我可能只需要使用另一个从另一个onnx到trt项目分配缓冲区。它在/usr/src

Deep learning 如何将RGB图像编码为PyTorch中的n_一类热张量

所以,我正在做一个分割任务,我需要做的是将一个RGB图像转换成一个n通道一个热矩阵,用作U-Net模型的标签 我所做的是计算图像中的颜色。数量或颜色与类的数量相等 我在PerPixelClassMatrix函数中尝试做的是迭代图像,并生成一个0和1的n维矩阵,因为我有每个像素的颜色和类别 import glob from tqdm import tqdm import numpy as np class HotEncoder(): def __init__(self, dir, ex

Deep learning Pytorch传递学习图像分类模型不收敛

我不知道我是否计算错了损失,但是 我的训练损失没有收敛;我正在使用Pytorch网站上的蚂蚁和蜜蜂数据集: (只需向下滚动一点) 以下是我的损失在24个时代的表现(如你所见) 我试图改变学习率,但似乎没有多大帮助) root_dir = "main_dir" image_transforms = transforms.Compose([ transforms.Resize((224,224)), transforms.ToTensor(),

Deep learning Pyrotch-模型参数权重的意外形状

我在Pytorch中创建了一个完全连接的网络,输入层为shape(1784),第一个隐藏层为shape(1256)。 简而言之:nn.Linear(输入特征=784,输出特征=256,偏差=True) 方法1:model.fc1.weight.data.shape给我torch.Size([128256]),而 方法2:list(model.parameters())[0]。shape为我提供了torch.Size([256784]) 事实上,在一个784大小的输入层和一个256大小的隐藏层之间

Deep learning Pytork至Onnx(OCR型号)

我试图在给定的回购协议中转换pytorch模型 到onnx 我在这样做的同时也面临着这个问题 Failed to export an ONNX attribute 'onnx::Gather', since it's not constant, please try to make things (e.g., kernel size) static if possible 链接到git问题 有什么建议吗 谢谢。在我的情况下不支持adaptive_avg_pool2d,此nn.AdaptiveA

Deep learning 如何处理非';使用Pix2pix进行图像到图像的转换?

,一个生成汉字的汉字表使用pix2pix生成图像。我还看到许多其他应用程序使用pix2pix执行与图像到图像转换无关的任务。我将zi2zi的代码与常规的pix2pix进行了比较,发现了一些我无法理解的实现 目标源是什么?随机噪声在哪里?与存在明显目标图像的图像到图像转换任务不同,角色生成的目标源应该是什么 假设unet的编码器部分的输出是潜在空间,那么当解码器受到编码器网络的跳转连接的影响时,我们应该如何将潜在空间设置为某个值,以便对潜在空间进行评估和探索 我想问pix2pix如何概括这些类

Deep learning word2vec:以不区分大小写的方式查找相似的单词

我可以访问我感兴趣的文本语料库中的词向量。现在,我面临的问题是,这些向量是区分大小写的,例如,“他”不同于“他”不同于“他” 我想找出与“他”一词最相似的词是不区分大小写的方式。我使用Googleword2vec软件包附带的distance.c程序。这就是我面临的一个问题 我是否应该将“Him”作为参数传递给distance.c可执行文件。这将返回关闭到3个单词的单词 或者我应该分别运行distance.c程序和3个参数(“Him”和“Him”和“Him”)中的每一个,然后以合理的方式将这些列表

Deep learning 如何找到keras模型的参数数量?

对于前馈网络(FFN),很容易计算参数的数量。给定CNN、LSTM等,是否有快速方法找到keras模型中的参数数量?模型和层有专门的方法: import keras.backend as K def size(model): # Compute number of params in a model (the actual number of floats) return sum([np.prod(K.get_value(w).shape) for w in model.trainab

Deep learning 如何用Keras建立卷积双向LSTM

我试图构建一个卷积双向LSTM来对DNA序列进行分类,本文: 它的简短版本是构建一个热编码DNA序列: `'ATACG...' = [ [1,0,0,0], [0,0,0,1], [1,0,0,0], [0,1,0,0], [0,0,1,0], ...],` 然后将其馈送到卷积relu最大池层以查找基序,然后馈送到双向LSTM网络以学习远距离依赖性 原始源代码是 然而,它使用了一个过时的Keras版本,并且包含了对Seya的依赖,这是我想要避免的。以下是我构建模型的第一次尝试: inputs

Deep learning 根据我们之前处理过的100多万个protos生成照片

我们正在运行一个庞大的团队,为我们的客户处理儿童照片,该团队每年处理100多万张照片 这个过程包括基本的灯光调节、调整大小、应用一些过滤器以使皮肤看起来更好 我们希望通过深入学习尽可能多地完成工作。这意味着我要选择一个模型,并使用我们现有的数据训练该模型。然后利用训练好的模型输入新的未处理照片生成照片 是否有我可以利用的现有模型,或者有任何论文介绍过这种情况 任何帮助都将不胜感激,谢谢 您可以尝试以下方法:。但是有了深入的学习和大量的培训数据,你就很难让任何足够大的模型正常工作。你可以尝试以下方

Deep learning 遇到连接异常学习D4Lj示例

你能帮我理解为什么我会遇到这个问题吗 14:22:15.752[main]INFO org.deeplearning4j.base.MnistFetcher-下载MNIST。。。 线程“main”java.net.ConnectException中出现异常:连接被拒绝(连接被拒绝) 位于java.base/java.net.PlainSocketImpl.socketConnect(本机方法) 位于java.base/java.net.AbstractPlainSocketImpl.doConn

Deep learning RNN如何从图像中提取特征

Hy,我目前正在写我的论文,这是建立乌尔都语的OCR。我有文字,写在图像上。在CNN中,我知道有卷积层和池层来学习模式或(提取特征)。我读到的关于RNN的内容是它学习序列。我想问一下RNN是如何提取特征的,图像中有什么 RNN网络使用随时间更新的隐藏层。采集样本并根据减少的误差(或损失)预测下一个样本。 LSTM是一种RNN,它克服了忘记长时间依赖的缺点。可能这种类型对你的论文很有用。RNN基本上需要一些功能和标签在训练阶段学习数据中的顺序。对于数字数据,没有任何问题,我们只需将数据集划分为特征

Deep learning 如何利用深度学习进行多项式地标检测

我正在尝试建立一个系统,使用深度卷积神经网络来分割车辆。我熟悉预测一定数量的点(即结束一个具有4个神经元的密集层的神经结构以预测两个点(x,y)坐标)。然而,车辆有许多不同的形状和尺寸,一辆车可能需要比另一辆车更多的分割点。如何创建一个具有不同输出值的神经网络?我想我可以使用某种RNN,但需要一些指导。多谢各位 例如,在下图中,两辆车具有不同数量的标记关键点 你有什么例子可以说明你需要什么吗?@Nightmerker,请看我添加的图片例子。谢谢这些要点将追踪汽车的轮廓,对吗?对…只是尝试执行图像

Deep learning 关于二维人体姿态检测的两个问题

1) 。我正在训练一个2D姿势检测网络,目前的计划是在训练集中添加MPII、LSP和Human3.6。看起来每个数据集的标记关键点集略有不同。我该怎么处理呢?据我所知,我应该修复网络的输出维度 2) 。我用的是tensorflow。我应该如何在2D热图上编写损失函数?(如果使用热图回归) 谢谢

Deep learning 如何在pytorch中共享两个模型的公共部分

我在使用pytorch实现模型时遇到问题 我想构建两个模型,其中一些是共享的,并像这样共享编码器部分 Model1: input_1 -> encoder -> decoder_1 -> ouput_1 Model2: input_2 -> encoder -> decoder_2 -> ouput_2 我想做的是让两个模型一起使用编码器部分,但解码器部分不一样。我查阅了有关参数共享的内容,但它似乎与此处的要求有所不同 我自己的想法是建立一个模型,包括编

Deep learning 如何为端到端语音到文本训练标记语音数据

我一直在想,我有一些音频数据,其中包含录制的句子,因此,当我将使用这些数据来训练神经网络时,我将如何标记这个音频句子文件?我是否只需提及音频文件中的工作,还是应该逐个字符地标记音频时间间隔。因此,如果有人能给我一个想法,如何实际标记音频数据来训练神经网络,以及神经网络的输出是什么

Deep learning 如何在pytorch中加载CUB-200-2011数据集?

我正在尝试对CUB-200-2011数据集进行细粒度图像分类,无法找到加载数据的正确方法。我使用预先训练的ImageNet ResNet-101进行训练,冻结除最后两层之外的所有层。建议在Pytorch中加载数据的方法。如何?有帮助吗?如果没有,你面临的问题是什么?您已经有一些代码要显示了吗?@kmario23,在您发送的报告中,“tgz_md5='97eceeb196236b17998738112f37df78'的确切含义是什么?这只是数据集的md5和。是为了确保数据在下载时没有损坏。正确下载

Deep learning 使用yolov4人脸检测和人脸识别

我是否可以使用yolov4进行目标检测并使用人脸识别库来识别检测到的人脸,或者我是否需要使用人脸识别库提供的人脸检测来使用其人脸识别?人脸识别库使用dlib专门用于人脸检测的内置算法。据称准确率为99%+。您不能将该算法更改为YoloV4或任何其他 人脸识别的网络体系结构基于ResNet-34,但层次较少,过滤器数量减少一半。该网络在一个包含300万张野生标记人脸(LFW)数据集的数据集上进行训练 看看Davis King(dlib的创始人)和Adam Geitgey(face_recognit

Deep learning 有没有更好的方法来计算多任务DNN建模的损失?

假设在多任务深度学习中有1000多个任务。超过一千列的标签。在这种情况下,每个任务(列)都有特定的权重。使用下面的代码段,在每个任务上循环计算损失的总和需要很长时间 criterion = nn.MSELoss() 这个数据集相当小。数据集有10K行和1024列,标签是10K*160稀疏矩阵。这160列中的每一列都是一项任务。批量大小为32。以下是输出、标签、权重的形状: len(outputs[0]), len(outputs) (32, 160) weights.shape torch.S

Deep learning 基于BERT的CNN卷积和最大池

我正试图通过插入CNN层来微调预先训练好的伯特模型(huggingface transformers)。 在该模型中,使用了所有变压器编码器的输出,而不仅仅是最新版本的输出 变压器编码器。 因此,每个变压器编码器的输出向量被串联,并生成矩阵: 卷积运算使用大小为3的窗口(在BERT_基本模型中为768的BERT的隐藏大小)执行,并通过以下方式为每个变压器编码器生成最大值: 对卷积输出应用最大池 通过连接这些值,生成一个向量,该向量作为全连接网络的输入。通过对输入应用softmax,执行分类操作

Deep learning 具有Imagenet类子集的MobileNetV2

我想使用一个预先训练过的MobileNet V2模型和ImageNet中的一部分类,如: 杯 汽车 树 灯 我如何在不使用该子集重新训练整个模型的情况下实现这一点?是否可以排除类

Deep learning 如何确定测试批量以充分利用NVIDIA Titan X

在训练深度学习模型时,我发现如果我将训练和验证(测试)批量大小设置为相同,例如32、64、…、512,GPU就没有得到充分利用 然后我检查NVIDIA Titan X规格: NVIDIA CUDA®核心:3584 内存:12 GB GDDR5X 为了减少CNN模型的测试时间,我希望尽可能多地增加一批样本的数量。我试过: 将每批样品数设置为3584,cuda超出内存错误 将每批样本数设置为2048,cuda超出内存错误 将每个批次的样本数设置为1024,有效。但我不确定GPU是否得到充分利用

Deep learning 使用im2col层、重塑层和内部产品层实现局部连接层?

我使用的是caffe,它没有本地连接层。那么,有没有关于如何使用im2col层、重塑层和内积层来实现本地连接层的示例?谢谢个人观点: 我还尝试使用Crop,Im2col,重塑和内部产品层来实现本地连接层,但失败 因为当我想使用InnerProduct层实现卷积运算时,我发现在InnerProductLayer::Forward\u cpu()函数中: caffe_cpu_gemm<Dtype>(CblasNoTrans, transpose_ ? CblasNoTrans : Cbl

Deep learning 为什么(MNIST训练)模型不擅长不在图片中心的数字 关于这个问题

我的CNN模型在MNIST数据集上的准确率高达99.4%。所以我尝试了一些不规则的输入。预测结果不正确 以下是我使用的一些不规则输入 正如我们所知,CNN卷积将扫描整个图像,也不关心图像中哪些区域的关键特征 为什么CNN不能处理不规则输入 正如我们所知,CNN卷积将扫描整个图像,也不关心图像中哪些区域的关键特征 这完全是错误的。CNN不“扫描”图像,单个过滤器可以被视为扫描,但整个网络没有。CNN由许多层组成,最终将减少信息量,并且在某些点上还使用特定于位置的功能(在最终完全连接的层中,在某

Deep learning 如何在火炬上训练caffe模型

我使用将caffe模型加载到torch,示例显示 require 'caffe' net = caffe.Net('deploy.prototxt', 'bvlc_alexnet.caffemodel', 'test') input = torch.FloatTensor(10,3,227,227) output = net:forward(input) gradOutput = torch.FloatTensor(10,1000,1,1) gradInput = net:backward(i

Deep learning 在MXNet(而非FC层)上进行微调

我是MXNet的新手,我想知道除了FC层之外,是否有人知道如何微调CNN中的更多层。我看到的所有示例都只在FC层上进行了微调。在Keras中,这可以很容易地完成,并且可以微调除FC块以外的更多CONVnet块: 如果我们只想微调FC块,我们将所有层的可训练性设置为false: layer.trainable=错误 如果我们想微调除FC层以外的更多ConnNet块,我们将这些层设置为layer.trainable=True: 我的问题是如何在MXNet中执行类似操作,答案取决于您使用的是命令

Deep learning 计算机视觉检测小物体效果不好的原因是什么?

目前,对于检测(定位+识别任务),我们主要使用计算机视觉中的深度学习算法。存在两种类型的探测器: 一个阶段:SSD,YLO,视网膜网 两阶段:例如RCNN、快速RCNN和快速RCNN 在非常小的物体(例如10个像素)上使用这些探测器是一项非常具有挑战性的任务,而且单阶段算法似乎比两阶段算法差。但我真的不明白为什么它在更快的RCNN上工作得更好。事实上,一级和两级检测器都使用锚概念,并且大多数检测器使用相同的主干,如VGG16或resnet50/resnet101。这意味着感受野是相同的。例如

Deep learning 如何选择小数据集神经网络的超参数和策略?

我目前正在做语义分割,但是我的数据集非常小 我只有大约700张带有数据增强功能的图像,例如,翻转可以 让它成为2100张图片 不确定这是否足以完成我的任务(语义分段和四个 课程) 我想使用批量标准化和小批量梯度下降 真正让我抓狂的是如果批量太小 批量规范化不太好,但如果批量较大 它似乎相当于全批量梯度下降 我想知道样品和批次之间是否有类似的标准比率 大小?首先让我谈谈你问题的第二部分“小数据集神经网络策略”。您可能希望在较大的数据集上建立一个预训练的网络,并使用较小的数据集对该网络进行微调。例如

Deep learning 如何使用ModelCheckpoint回调加载tensorflow模型?

我已经训练了一个模型,并使用ModelCheckpoint保存权重: checkpoint_callback = ModelCheckpoint( filepath = checkpoint_prefix, save_weights_only = True, save_freq = 'epoch') 在我的模特训练的晚上,停电了一段时间,我的电脑也关机了。现在我打开我的Jupyter笔记本,我想加载我的模型,而不需要从一开始就对它进行训练。我应该如何做到这一点而不重新编

Deep learning &引用;TextInputSequence必须是str”;拥抱变形金刚的错误

我对拥抱脸很陌生,我在笔记本上遇到了一个错误“TextInputSequence必须是str”,这对我在各种拥抱脸模型上进行练习有很大帮助笔记本上的样板代码抛出了这个错误(我猜),这是由于huggingface的API发生了一些变化。所以我想知道是否有人可以建议我对代码进行一些更改以解决错误 只需运行笔记本的所有单元格,即可轻松重现错误。 链接: 这是抛出错误的行- 这是错误,谢谢你的回复,截图的重点不是代码,而是我想通过指出导致错误的那行代码来帮助你,因为我提供了整个笔记本的代码。但是,如果这

Deep learning 用于深度学习的3D张量:使用矩阵xD<;ArrayXd,动态,动态>;

我目前使用Eigen进行深度学习,更具体地说是卷积神经网络 您可以在此处看到一个示例: 在每一步中,一个层可以是一个卷积层(一组特征映射)、一个完全连接的层(一个一维向量)或其他任何东西 所以我选择MatrixX来表示我的数据 但是当我使用它(矩阵积)时,我有很多缺点 我不确定,但我认为是因为ArrayXd不是MatrixX的好标量类型 我可以使用ArrayXd作为特征值中的标量吗 如果答案是否定的,我能做什么 ArrayXd作为标量类型不是一个好的选择,尤其是当您需要张量时 Eigen在其开发

Deep learning 检查模型目标时出错:预期预测具有形状(无,1000),但获得具有形状(64,2)的数组

迄今为止: 我正在尝试重塑标准的KerasVGG16模型,以用于经典的猫狗比赛() 我必须重新创建Sequential()Keras模型的pop()和add()函数,以移除最后一个densed(1000)层,并将其替换为densed(2)层 但是,当我尝试使用fit\u generator()函数时,出现以下错误: ValueError: Error when checking model target: expected predictions to have shape (None, 100

Deep learning 在theano 0.9的gpu上使用3D卷积时cpu利用率高

使用theano.tensor.nnet.conv3d时,我的cpu利用率为100% 我在theano函数的编译模式中添加了conv3d_fft、convgrad3d_fft和convtransp3d_fft。 有趣的是我的gpu利用率也很高。我的数据都在gpu内存中 你知道为什么it cpu利用率这么高吗 谢谢 更新:我在Keras中使用Theano后端尝试了相同的卷积。它比theano快得惊人,尽管它也使用conv3d。在GPU上调用任务时,CPU必须做一些工作(不能忽略)。如果GPU上的任

Deep learning 在对看不见的数据应用LSTM之前,应考虑哪些因素

我有一些文本数据,我想在这些数据上训练一个分类器——为此,我使用了一个LSTM。 我标记并矢量化了我的文本数据,这样像“快速棕色狐狸”这样的易读文本就变成了填充序列“[1,0,0,25,…]”等等 已成功训练了一名模型。现在,我需要将此模型应用于看不见的文本数据(不是训练集或测试集的一部分) 我最初考虑从未看到的数据中删除训练/测试数据中不存在的所有单词。但这看起来也不是一个解决方案,因为在对看不见的文本数据进行标记时,训练数据中的单词可能会映射到看不见的数据中的新数字 所以 训练数据中的fo

Deep learning 在使用CNN时,将category()定义为错误

将CNN用于手写数字 没有任何代码,很难提供帮助,但在Keras>2.0中,to_categorial的参数是y和num_类,但似乎您正在尝试传递nb_类 有关更多详细信息,请查看api文档。 请将堆栈跟踪作为文本,而不是图像。您需要提供更多详细信息X_train=X_train。重塑(-1,1,28,28)X_test=X_test。重塑(-1,1,28,28)y_train=np_utils。to_category(y_train,nb_classes=10)y_test=np.utils.

Deep learning Keras中的多个类

提前感谢所有花时间回答这个问题的人。我在学习Keras,遇到了一个问题,我有3门课,测试集的准确度上升到了0.6667,然后在50个历史时期的精确数字上停滞。如果它是正确的,那么准确度也比它应该的要高。当我只上了2节课时,这很好 我做错了什么 import pandas as pd import numpy as np import keras.utils #Create train and test data def create_Xt_Yt(X, y, percentage=0.8):

Deep learning 密集层之间的展平操作

在Keras实现中,我曾经看到最后两个完全连接的层定义如下 outX = Dense(300, activation='relu')(outX) outX = Flatten()(outX) predictions = Dense(1,activation='linear')(outX) 在两个密集层之间,有一个展平层,为什么我们必须在两个完全连接的层之间添加展平操作。这总是必需的吗?简短回答:展平层本身没有任何参数可供学习。然而,在模型中添加一个展平层可以增加模型的学习参数 示例:尝试找出这

Deep learning 对约洛感到困惑吗

我对Yolo的工作方式有点困惑。 在论文中,他们说: “置信度预测表示 预测框和任何地面真相框。” 但是,我们如何拥有地面真相箱呢?假设我在一张没有标签的图像上使用我的Yolo网络(已经训练过)。那么,我的信心是什么呢 对不起,如果问题很简单,但我真的不明白这部分。。。 谢谢大家! 约洛用借条来测量训练时的体重。当你搜索借条是什么的时候,它是这样的 因此,当训练这个IoU分数时,计算对验证数据的预测。这意味着 (Prediction of object)*IoU score 希望对你有帮助 但

Deep learning Pyrotch toturial的大小不匹配错误

我正在学习一个叫做PyTorch深度学习的教程:PyTorch网站上60分钟的闪电战。我的代码与它的代码相同,但存在如下所示的大小不匹配错误。有人能告诉我为什么以及如何解决这个问题吗?谢谢:) 运行时错误:大小不匹配,m1:[80 x 5],m2:[400 x 120]at c:\a\w\1\s\tmp\u conda\u 3.7\u 110509\conda\conda bld\pytorch\u 1544094576194\work\aten\src\th\generic/THTensorM

Deep learning 递归神经网络与连续变量

我在使用RNN处理连续数据时遇到问题。到目前为止,我已经使用MEL spectrogram作为我的聆听、参与和拼写架构的输入,但我决定通过插值spectrogram bin数据而不是使用MEL来处理该输入。以下是一个如何实现这一目标的示例: 这个想法很简单,在创建MEL光谱图的过程中信息会丢失,一些组件会移位等。我的目标是尝试看看某种预处理是否可以帮助深度网络在学习过程中发挥作用,但我无法表达这种新形成的输入以匹配RNN。MEL spectrogram是2D数据,包含最终数量的箱子,比如说39个

Deep learning 比较深度学习中数据加载方法的效率

我需要加载一个时间序列数据集来训练网络。当我从原始数据中提取这些.npy文件时,由于内存问题,train\u x\u 0.npy,train\u x\u 1.npy,…,train\u x\u 40.npy(41个块),数据集被分成许多块。但是,它们的大小太大(大约1000 GB),我无法将所有内容都加载到RAM中。我一直在考虑两种方法来解决这个问题 使用np.load()和参数mmap_mode='r+'加载数据块。内存映射块存储在Python列表self.data中。在PytorchData

Deep learning 在Detectron2中检测小对象

创建此问题的目的是开始讨论使用API检测小对象的问题。互联网上的讨论很少,也不充分,我认为这篇文章也会帮助其他人完成类似的项目 我在我的项目中使用的是在图像上检测多个对象。物体探测器有两种模式。在第一种模式中,探测器检测整个物体。比如汽车。在第二种模式中,探测器检测物体的部位。例如,车轮、门和灯 现在在第一种模式下,探测器工作正常。但在第二种模式下,精确度会急剧下降。因为照片上的汽车很小,所以汽车零件更小。这就是为什么我的第一个猜测是,由于检测到小物体,精度会下降。但是我似乎找不到一个合适的方法

Deep learning 条件训练问题

我使用了来自()的数据集,并希望使用条件gan生成人脸图像,我引用了来自()和(mvedang/Conditional-gan-CIFAR-10)网络体系结构的网络体系结构,但无论我对其进行了多少次训练,生成的图像仍然是噪声 即使我调整鉴别器和生成器的参数,如层、神经元等,生成的结果仍然是噪声 你能帮我纠正我构建的生成器和鉴别器模型吗? 代码和结果链接: : : def build_cgan_generator(z_dim): z_input = Input(shape=(z_dim,)

Deep learning 有可能组合两个神经网络吗?

我有一张网像(例自) 和另一个类似网络的(例如) 例如,我想更改“self.fc2=nn.Linear(120,84)”以获得121个输入,其中第121个是二进制分类网络的x(输出)。 我的想法是:我想同时使用CNN网络,而不是CNN网络,来训练两者,相互影响 可能吗?我该怎么做呢?(Keras或Pytorch示例都可以) 或者这个想法很疯狂,有更简单的方法将数据和图像混合作为一个独特网络的输入?最简单的方法是实例化两个模型,将两个预测相加,并用它计算损失。这将通过两种模型反向传播: net1

上一页   1   2    3   4   5   6  ... 下一页 最后一页 共 45 页