Deep Learning_IT技术博客_编程技术问答

Deep learning Caffe是否可以扩展到多个CPU核？

标签： Deep Learning caffe

我希望在32核机器上运行Caffe caffe是否扩展到可用的芯数，以最佳利用它们虽然有32个核，但我可以让caffe只使用选定数量的核吗通常，caffe在其源代码中不支持多个CPU/内核，但它使用BLAS例程因此，您的问题的答案如下：是，但仅通过BLAS配置，即。E您的BLAS版本应使用多线程支持进行编译（请参阅相关讨论：或-在第二个链接中，您还可以找到对caffe本身的一些修改）也可以通过BLAS（如果它是使用openmp支持编译的，您可以将OMP\u NUM\u线程定义为所需的值

Deep learning 添加Xavier和bias_填料后，损耗值开始变为负值。为什么？

标签： Deep Learning caffepycaffematcaffe

在我将xavier初始化添加到每个卷积层之后，损失开始变得负。有人能给出任何建议/理由吗？我在所有卷积层中添加了以下行： weight_filler { type: "xavier" } bias_filler { type: "constant" value: 0.1 } 我的另一个问题是，在某些网络中，添加了Gaussian。比如： weight_filler { type

Deep learning seq2seq模型训练方法的选择你可以推荐什么样的训练方法来训练基于注意顺序的序列神经机器翻译模型？SGD，Adadelta，Adam还是更好的？请给出一些建议，谢谢。

标签： Deep Learning sequence-to-sequenceattention-model

使用自适应梯度算法，如Adam、ADADDelta或RMSProp。我倾向于使用Adam，并且总是与剪裁的渐变相结合自适应梯度算法对每个参数都有学习率。当模型中某些参数可能更稀疏（增加其学习率）或不稀疏（降低其学习率）时，这非常有用。如果你正在使用像神经机器翻译之类的东西，这种稀疏性是一个问题。我想Adam在计算上要贵一点，但它给出了很好的结果

Deep learning 如果export_weights_和_bias参数设置为FALSE，如何在h2o模型中提取权重和偏差？

标签： Deep Learning pojoh2ocheckpoint

我有一个h2o深度学习模型，“model1”，它概括得非常好。不幸的是，我在构建模型时忘记设置导出权重和偏差=TRUE 我尝试重新训练了许多模型，其中包含了原始模型1中的所有精确参数、种子和数据集，并将导出权重和偏差设置为true 不幸的是，这些新模型中没有一个能很好地推广。事实上，尽管所有模型都能很好地进行训练、验证、交叉验证和测试，但它们在推广上都失败了。我甚至尝试检查原始模型1，以便添加导出权重和偏差参数=TRUE。但是，因为我没有使用模CV，所以无法检查点不可再生性让我头痛不已。为了实

Deep learning GPU内存使用率高，但易失性低

标签： Deep Learning Keras lstmword2vectensorflow-gpu

Keras和DL新手在这里。我想建立一个模型来训练序列文本数据进行分类。数据如下所示： id、文本、标签 1，汤姆。吃午饭 2，杰瑞。德林克沃特，1 我用python3.5和keras2（TF作为后端）构建了它。模型摘要如下所示：第一层/输入层是word2Vec嵌入，它是从头开始构建的，有4332个字第二层是一个简单的LSTM层，其参数包括：（稠密\u dim=100，内核\u初始化器='he\u normal'，dropout=0.15，递归\u dropout=0.15，实现=2）然后

Deep learning 我应该将预处理的图像数据保存到磁盘吗？

标签： Deep Learning

我正在参加一个摄影比赛。我有近50000个培训数据，涉及80个不同的课程。我用一些预训练的模型做了一些测试，比如Vgg或Resnet，两者都很好，但不够好，训练acc几乎为1，验证acc为0.85（过度拟合）。我认为瓶颈在于数据，而不是模型，所以我提出了图像增强现在我很困惑，是应该将转换后的图像保存到磁盘上，还是只对每个历元的每一批应用随机转换。我现在正在练习后一种方法，但效果并没有太大改善。保存或不保存预处理的数据首先是时间问题，如果预处理过程中存在任何随机性，则需要大量重复性如果不需要花

Deep learning 保存和加载模型后，Pyrotch中的结果不可再现

标签： Deep Learning Pytorch

保存并加载模型后，我无法在PyTorch中重现结果，而内存中的模型按预期工作。仅出于上下文考虑，我正在为我的库设定种子，使用model.eval关闭辍学者，但结果仍然不可复制。如果我遗漏了什么，有什么建议吗。提前谢谢我正在使用的库：- import matplotlib.pyplot as plt import torch from torch import nn from torch import optim import torch.nn.functional as F from torc

Deep learning 为什么转换成im2col很快？

标签： Deep Learning conv-neural-networkcaffe

原始输入激活通过im2col进行内核转换，以改进内存访问模式。但是，当我们将原始矩阵转换为im2col矩阵时，我们也在访问相同的原始内存模式。那么，为什么im2col运算本身并不慢呢？im2col的主要原因是，输入和核可以表示为两个大矩阵，卷积可以在单个矩阵乘法中完成。这加快了过程，因为矩阵乘法可以并行性非常好只是内存访问不是问题，正如你所说，im2col必须像简单的卷积运算一样访问原始张量

Deep learning 尝试将彩色图像转换为灰度图像

标签： Deep Learning Computer Vision

错误回溯（最近一次呼叫上次）在里面 3. 4对于列车数据中的i： ---->5灰色=cv2.CVT颜色（i，cv2.COLOR_BGR2GRAY） 6列车数据\灰色附加（灰色）七, 错误：OpenCV（4.4.0）c:\users\appveyor\appdata\local\temp\1\pip-req-build-j8nxabm\OpenCV\modules\imgproc\src\color.simd\u helpers.hpp:94：函数“\uu cdecl cv:：impl:匿名名

Deep learning 如何计算多层感知器中每一层的in_特征？

标签： Deep Learning Neural Network Pytorch perceptron

不同层的in_特征之间的比例合适吗？它应该是整数吗？例如，它是解决CIFAR10的全连接网络的一部分： self.fc1 = nn.Linear(32*32*3, 256) self.bn1 = nn.BatchNorm1d(256) self.fc2 = nn.Linear(256, 64) self.bn2 = nn.BatchNorm1d(64) self.fc3 = nn.Linear(64, 10) 为什么教程中的作者在第二层使用256个节点，在第三层使用64个节点？或者可能有完全

Deep learning ResNet模型不与深度数据收敛

标签： Deep Learning training-datadepthresnet

我正在使用以下配置对ResNet-34进行深度图的全面培训： 11560/1360的拆分，用于列车/验证尺寸为640*480的图像批量：16 学习率：10-3，如果验证损失在5次迭代中仍不减少，则减少10-1 我有下面的历史记录，谁能解释一下是过度拟合还是欠拟合的问题，我能做些什么使模型收敛 Epoch 1/200 1445/1445 [==============================] - 586s 406ms/step - loss: 1.7617

Deep learning flax（谷歌）和dm俳句（deepmind）的主要区别是什么？

标签： Deep Learning Neural Network jax

和之间的主要区别是什么根据他们的描述： Flax，一个用于JAX的神经网络库俳句，受十四行诗启发的JAX神经网络库问题：我应该选择哪一个基于jax的库来实现，比方说模型（由CNN层+LSTM层+FC组成）和ctc损失 UPD 发现与dm haiku开发者的差异： Flax包含了更多的电池，并配备了优化器、混合精度和一些训练循环（我被告知这些都是解耦的，您可以使用任意数量的电池）。俳句旨在解决NN模块和状态管理，它将问题的其他部分留给其他库（例如，优化optax）俳句被设计成Son

Deep learning Keras中的多维输入层

标签： Deep Learning Keras keras-layer

Keras中的哪些层可以用作第一层以获取多维特征？我想使用一个有1275个特征，有11个通道的密集层，但看起来我只能使用卷积层或循环层来处理2维或更多维的特征。这是正确的吗？据我所知，您是正确的，但您可以重新塑造数据，使其具有1275*11特征，然后在其上运行一个密集层。有一个重塑层（）和一个展平层（）对于密集层，通常先将输入展平

Deep learning 识别一个特定对象（或场景）的训练模型

标签： Deep Learning conv-neural-networkimage-recognition

我试图训练一个学习模型来识别一个特定的场景。例如，假设我想训练它识别在游乐园拍摄的照片，而我已经有一万张在游乐园拍摄的照片。我想用这些照片来训练这个模型，这样它就可以给其他照片打分，这些照片可能是在游乐园拍的。我该怎么做？考虑到这是一个图像识别问题，我可能会使用卷积神经网络，但我不太确定在这种情况下如何训练它谢谢有几种可能的方法。最简单的方法是收集大量负面示例（来自其他地方的图像）并训练一个两类模型第二种方法是训练网络从输入图像（嵌入）中提取有意义的低维表示。在这里，您可以使用暹罗训练明

Deep learning caffe无法打开或找到文件

标签： Deep Learning caffeconv-neural-network

我是caffe的新手，在成功运行了一个示例后，我尝试使用自己的数据。但是，当尝试将数据写入lmdb数据格式或直接尝试使用解算器时，在这两种情况下，我都会出现错误： E0201 14:26:00.450629 13235 io.cpp:80] Could not open or find file ~/Documents/ChessgameCNN/input/train/731_1.bmp 731 路径是正确的，但奇怪的是标签731是此错误消息的一部分。这意味着它将其作为路径的一部分而不是标签来

Deep learning 不同Caffe'的计算考虑；s网络拓扑（输出数量差异）

标签： Deep Learning caffe

我想使用Caffe的参考模型之一，即bvlc\u reference\u caffenet。我发现我的目标类，即person，是ILSVRC数据集中包含的类之一，该数据集已针对模型进行了培训。由于我的目标是对测试图像是否包含人员进行分类，我可以通过以下方式实现这一点：直接使用1000个输出的推断。这并不重要需要培训/学习稍微更改网络拓扑，将最终FC层的输出数（num_output）设置为2（而不是1000）。将其重新训练为二进制分类问题我关心的是部署/预测阶段（测试）的计算工作。后者在计

Deep learning 验证准确度是否总是可能与培训准确度一样高？

标签： Deep Learning Keras

我有一个非常小的数据集（40个训练示例、10个验证示例、120个类），通过Keras中非常简单的模型（仅限batchnorm、flatten和dense layers），我获得了非常高的精确度我的训练准确率为94-95%，验证准确率为76-78%。我知道这太过分了，我试过一些方法。数据不是图像，因此我无法扩充数据。我也无法添加数据，因为它是特定类型。我使用了两个0.5级的退出层，架构非常简单，所以我认为我不能降低架构的复杂性。如果有人喜欢，我可以粘贴模型我的问题是：是否曾经有过这样的情况：验

Deep learning OpenAI健身房键盘_agent.py：如何重新启动？

标签： Deep Learning reinforcement-learningopenai-gym

我想使用来播放Breakout-v0。当我以以下方式启动环境时： python [...]/gym/examples/agents/keyboard_agent.py "Breakout-v0" 比赛开始了，我可以打第一轮没问题。但是我不能让它重新启动在代码中，我们有： if key==0xff0d: human_wants_restart = True 我不能去工作。0xff0d是全宽连字符减号。我做错了什么，或者如何生成此字符？重新启动是enter，暂停是space

Deep learning 如何分析和解释RBM学习到的特征？

标签： Deep Learning mnistrbm

我已经训练了一个单层，100个隐藏单元RBM，带有二进制输入单元和隐藏层上的ReLU激活。使用50k MNIST图像的训练集，经过500次动量和L1权重惩罚的整批训练后，我在10k图像测试集上得到了约5%的RMSE 看下面的可视化，很明显隐藏单位之间有很大的差异。有些似乎已经收敛到一个非常明确的响应模式，而另一些则无法与噪声区分开来我的问题是：您如何解释这种明显的变化，以及什么技术可能有助于实现更平衡的结果？像这样的情况需要更多的正规化、更慢的学习、更长的学习时间，还是其他什么

Deep learning 在贝洛特纸牌游戏中使用CNN进行竞价

标签： Deep Learning Artificial Intelligence conv-neural-network

我有这个想法，利用有线电视新闻网学习贝洛特投标人。我们有32张卡片，竞买人只有5张。我把它们放在一个“图像”4x8中，arr[r][s]=1，如果他有suit s和rank r的卡，如果他没有，则为0 图中只有5个。然后我用蒙特卡罗算法模拟N次可能的出价，并用每个出价的概率做一个向量。总数为1 在这之后，我试图学习CNN，但无论我做什么，它都没有学好，也没有推广。也许输入数据对CNN没有用处，也许我需要使用其他东西，但最重要的是-我需要它来很好地概括，因为输出的计算非常昂贵，我只想做一次，保

Deep learning 丢失、val_丢失、acc和val_acc不会在所有历代更新

标签： Deep Learning Keras classification

我为序列分类（二进制）创建了一个LSTM网络，其中每个样本有25个时间步和4个特征。以下是我的keras网络拓扑：上面，密集层之后的激活层使用softmax功能。我使用二进制交叉熵作为损失函数，Adam作为优化器来编译keras模型。使用batch_size=256、shuffle=True和validation_split=0.05对模型进行训练，以下是训练日志： Train on 618196 samples, validate on 32537 samples 2017-09-15 0

Deep learning 如何在培训期间以Keras打印/返回softmax分数？

标签： Deep Learning Keras

问题：如何使用Keras打印/返回用于多类问题的softmax层我的动机：这对于可视化/调试很重要这对于“培训”环境很重要。ergo批处理规范化和退出必须像在列车运行时一样它应该是有效的。偶尔调用vanilla model.predict（）不太可取，因为我使用的模型很重，这是额外的向前传递。最理想的情况是找到一种简单地显示训练期间计算的原始网络输出的方法可以假设这是在使用Tensorflow作为后端时完成的谢谢。您可以使用：model.layers[index].output获得

Deep learning 在pytorch中，如何使用F.cross_entropy（）中的权重参数？

标签： Deep Learning Pytorch cross-entropy

我正在尝试编写一些代码，如下所示： x = Variable(torch.Tensor([[1.0,2.0,3.0]])) y = Variable(torch.LongTensor([1])) w = torch.Tensor([1.0,1.0,1.0]) F.cross_entropy(x,y,w) w = torch.Tensor([1.0,10.0,1.0]) F.cross_entropy(x,y,w) 然而，交叉熵损失的输出总是1.4076无论w是什么。F.cross_熵（）的权重

Deep learning 基于变压器的解码

标签： Deep Learning transformerseq2seqencoder-decodersequence-modeling

变压器模型中的解码器可以像编码器一样并行吗？据我所知，编码器拥有序列中的所有标记来计算自我注意分数。但对于解码器来说，这是不可能的（在训练和测试中），因为自我注意是根据之前的时间步输出计算出来的。即使我们考虑了一些像教师强制这样的技术，在这里我们将获得的输出与所获得的连接串联起来，但仍然有来自先前的时间步长的顺序输入。在这种情况下，除了在捕获长期依赖性方面的改进外，当纯粹基于并行化进行比较时，使用转换器解码器是否比使用lstm更好？您是正确的，因为lstm解码器和转换器解码器一次处理一个令牌，即

Deep learning 为什么损失用swa法跳到nan？

标签： Deep Learning Pytorch loss

我使用SWA方法在pytorch中训练模型西南航空：我的列车代码丢失了，很快就跳到了南模型的损失跃升至nan 损失输出如下 1.损耗：张量（4.8463，装置=cuda:0'，梯度fn=） 2.损耗：张量（118317.8516，装置=cuda:0'，梯度fn=） 3.损耗：张量（5.7568e+22，装置=cuda:0'，梯度fn=） 4.损耗：张量（nan，装置=cuda:0'，梯度fn=）没有SWA方法，损失不会增加。采用SWA方法的列车模型代码是否存在任何问题如果您有任何建议

Deep learning 神经网络角度检测

标签： Deep Learning Neural Network conv-neural-networkyolo

我有一个1000张来自不同角度的软玩具图片的数据集。例如：我必须使用一些神经网络和训练来检测我的玩具，并输出它的角度。我想看看：类概率角。例如：是否有方法使用Tensorflow或Darknet修改SSD或YOLO，以修改框架/网络，甚至在YOLO中计算和输出角度？在搜索互联网时，我没有找到能做类似事情的网络示例

Deep learning 关于将Alpha zero general应用于不同游戏的问题

标签： Deep Learning

我正在尝试使用alpha zero general应用于不同的游戏（有点像国际象棋），这是Otherlo的原始代码：然而，经过几次迭代（大约300次自玩），它看起来仍然像是在做无意义的动作。所以我想知道我的代码是否错了。以下是我提出的几个问题：是否应该修改num_通道？注意：我实际上对参数“通道数”感到困惑。在我看来，《奥赛罗》最多应该是3首（只有“黑色”、“白色”和“无”类型的曲子），但是，在最初的情况下，num_channels被设置为128首另一个问题是关于“董事会”，这将是nn

Deep learning 使用Colab和Pytorch3D的Mesh-R-CNN数据

标签： Deep Learning Pytorch Google Colaboratory pytorch3d

在Google Colab上使用Mesh-R-CNN演示时：在demo.py文件中，我收到了这条消息 ModuleNotFoundError Traceback (most recent call last) <ipython-input-24-202aa0a6d1de> in <module>() 17 18 # required so that .register() calls are execu

Deep learning 将手动注释数据加载到列车RNN位置标记器

标签： Deep Learning Pytorch recurrent-neural-networkpart-of-speech

我有一个大的手动注释数据。我想用RNN训练词性标记器。数据与以下文本类似： Lorem <NP> Ipsum <NP> dummy <N> text <ADV> printing <VREL> typesetting <NUMCR> Ipsum <VREL> Ipsum <NP> Ipsum <NP> Lorem <N> Ipsum <NP> Ipsum <N

Deep learning torch.UNSQUEZE和target.UNSQUEZE之间的差异

标签： Deep Learning Pytorch

我通过计算MSE来训练一个简单的MLP，并得到以下错误：用户警告：使用与输入大小（torch.size（[1,1]）不同的目标大小（torch.size（[1,1]）。这可能会由于广播而导致错误的结果。请确保尺寸相同下面给出了正确的解决方案 target=target.unsqueze（1）而torch.unsqueze（target，1）不会。前者来自前者，后者来自后者为什么后者修复了用户警告消息，而前者没有呢？火炬。unsqueze返回一个新的张量，在指定位置插入一个大小为1的维度。这

Deep learning 为什么我的损失在训练10个阶段后没有减少？

标签： Deep Learning Pytorch loss-function

我的硬件是Ryzen 5000系列cpu，带有nvidia rtx 3060 gpu。我目前正在做一项学校作业，涉及使用深度学习模型（在PyTorch中实现）从CT切片图像预测新冠病毒诊断。可以在GitHub上的以下url处找到数据集：我已经编写了一个自定义数据集，它从数据集中获取图像，并将其大小调整为224x224。我还使用skimage.color将所有rgba或灰度图像转换为rgb。其他变换包括随机水平和垂直翻转，以及ToSensor（）。为了评估模型，我使用sklearn.metric

Deep learning 用神经网络逼近多元函数，使用哪种激活函数？

标签： Deep Learning

我想近似一个多变量函数，如下所示：我曾考虑使用Sigmoid函数来保持连续输出，但我想知道是否有更好的选择谢谢我不会选择乙状结肠。只要保持最后一层线性，因为它没有边界，没有消失的梯度。@Gulzar谢谢你，你的意思是我不应该为最后一层使用传递函数吗？@Gulzar其他隐藏层的传递函数如何？你可以使用所有线性层，使用泄漏的relu激活。这是最标准和最直接的，从那里开始。是的，最后一层没有激活。

Deep learning 理解deconv层数学

标签： Deep Learning caffeconv-neural-network

我需要帮助。试图了解deconv层的数学原理。让我们谈谈这一层： layer { name: "decon" type: "Deconvolution" bottom: "conv2" top: "decon" convolution_param { num_output: 1 kernel_size: 4 stride: 2 pad: 1 } } 因此，基本上，这一层应该将图像“放大”2倍。如果我查看学习到的权重，我会看到，例如： -0

Deep learning 需要帮助了解用于多标签丢失的SigmoidCrossEntropyLossLayer的Caffe代码吗

标签： Deep Learning caffelogistic-regressioncross-entropy

我需要帮助理解Caffe函数，SigmoidCrossEntropyLossLayer，这是逻辑激活的交叉熵误差基本上，具有N个独立目标的单个示例的交叉熵误差表示为： - sum-over-N( t[i] * log(x[i]) + (1 - t[i]) * log(1 - x[i] ) 其中，t是目标，0或1，x是输出，由i索引x，当然要经过物流激活加快交叉熵计算的代数技巧将计算减少到： -t[i] * x[i] + log(1 + exp(x[i])) 你可以从第3节中验证这

Deep learning 如何执行多标签分类（CNN）？

标签： Deep Learning

我目前正在研究多标签分类，我有一些问题，我找不到明确的答案为了清晰起见，让我们举个例子：我想对汽车、公共汽车、卡车的图像进行分类。。。他们生产奥迪、大众、法拉利所以我想训练两个独立的CNN，一个用于类型分类，另一个用于make分类，但我认为可能在所有课程上只训练一个CNN 我读到人们倾向于使用sigmoid函数而不是softmax来实现这一点。我知道sigmoid不能像softmax那样总结为1，但我不知道这样做可以实现多标签分类吗我的第二个问题是：有没有可能考虑到某些类是完全独立的第三

Deep learning 用于图像识别的预训练卷积神经网络的硬件要求

标签： Deep Learning gpuhardware

我知道，为了训练用于图像识别的深层神经网络，需要一个好的GPU或GPU，因为它们比CPU更适合这个任务。这一切都很清楚，有很多不同的教程使用不同的库如何做到这一点然而，当我训练了我的深度神经网络后，在服务器上的某个web应用程序中运行经过训练的深度神经网络识别图像的硬件要求是什么？服务器上是否需要强大的GPU？对于运行预先训练好的深度神经网络，什么硬件更重要？RAM、CPU、存储器我可以在Android应用程序上运行预先训练过的网络进行图像识别吗？这是个好主意吗很抱歉，如果我的问题太模糊

Deep learning Volatile gpu util是100%，并且在推断大量图像后在PyTorch1.1上没有任何进展

标签： Deep Learning gpu Pytorch nvidia

我在NVIDIA V100 GPU上部署了一个预训练的deep模型。在推断了大量图像后，我发现易失性GPU UTIL仍然显示100%，但现在没有进行推断。如何解决这个问题当我键入nvidia smi时，它显示： +-----------------------------------------------------------------------------+ |NVIDIA-SMI 384.183驱动程序版本：384.183 CUDA版本：9.0 | |---------------

Deep learning 如何在pytorch中将不同通道中不同宽度的样本输入大小设置为Conv1d

标签： Deep Learning Pytorch

我是深度学习的新手，我正在编写一个1D CNN模型来训练我的数据集。数据集中的每个数据都包含三个通道：（原始数据、性别、年龄）。raw_data的采样率为50Hz，窗口大小为2秒，这意味着一个数据中有100个样本。所以我的数据看起来像这样（[1,2,3,4，…，100]，[1]，[20]）其中[1]表示性别，[20]表示年龄现在我想把这些数据放到我的一维CNN模型中。我知道nn.Conv1d（批量大小、通道、宽度）。如果所有通道中的宽度相同，则没有问题。但在我的例子中，raw_数据包含100

Deep learning 如何提取CBOW模型的嵌入权重？

标签： Deep Learning Nlp Pytorch

我目前正试图在上实现CBOW模型，以获得培训和测试，但对于最终从模型中提取权重作为单词嵌入的“正确”方法，我面临一些困惑模型主要过程在使用训练和测试数据通过解算器运行模型后，我基本上告诉train和test函数也返回所使用的模型。然后我将嵌入权重分配给一个单独的变量，并将其用作单词嵌入使用交叉熵损失进行训练和测试，每个训练和测试样本的形式为（[上下文词]，目标词）我不确定这是否是提取和使用嵌入的正确方法。通常有其他的方法吗？提前感谢。是的，model\u train.embed.wei

Deep learning 雷鲁不行，乙状结肠也行

标签： Deep Learning mobilenet

当我在输出层使用sigmoid时，有一个现象让我感到困惑，那就是网络运行良好。但是，如果我将输出的激活设置为Relu，则网络不会收敛。在第一个历元之后，训练损失不会减少。有人能解释这种现象吗网络的输入是图像。像素被重新缩放为0-1。输出为0-1之间的一个值谢谢。从您的上述问题中我了解到，当您使用ReLu作为最终激活时，模型不会收敛：如果是这种情况，那么答案就在ReLu函数本身中，ReLu所做的是，它不会在[0,1]之间缩放网络输出，而是返回max（0,x），这是您不希望在输出/基本真理在[

Deep learning Resnet50不收敛。VGG16工作正常

标签： Deep Learning resnetvgg-net

我用resnet50作为主干训练了一个回归网络。网络的输入是大小为224*224*3的图像，网络的输出是一个值，从0到1不等但是netwrok不能收敛，无论我使用sigmoid还是relu作为输出层的激活mae或mse作为损失函数例如，我使用resnet50作为主干，mae作为损失函数，sigmoid是输出层的激活函数SGD作为优化器。培训损失将是： Epoch 1训练损失为0.4900，val_损失为0.4797 Epoch 2训练损失为0.4923，val_损失为0.4794 Epoch

Deep learning 在TPU中使用TFR记录进行图像分割，从而减少训练损失

标签： Deep Learning image-segmentationtensorflow-datasetstpu

我是一个试图在Kaggle内核中使用Tensorflow来使用TPU的初学者。我以前在GPU中使用数据集训练了一个Unet模型，现在我正试图在TPU中实现它。我用数据集图像和掩码创建了一个tfrecord，tfrecord返回图像和掩码。当我尝试在TPU训练时，损失总是Nan，即使度量的准确性是正常的。由于这与我在GPU中使用的模型和损耗相同，我猜问题出在tfrecord或加载dataset中。加载数据的代码如下所示： def decode_image(image_data): im

Deep learning 什么'；在Tesseract 4+；光学字符识别？

标签： Deep Learning lstmtesseractpython-tesseract

我发现Tesseract 4+LSTM中使用的模型与OCROpus CLSTM项目中使用的模型相同，可在此处获得：在下面的链接中，我找到了有关lstm模型的信息，但我无法从中绘制模型的架构。 CLSTM项目中lstm模型的信息： .Stacked: 0.000100 0.900000 11 13 .Stacked.Parallel: 0.000100 0.900000 11 40 .Stacked.Parallel.NPLSTM_SigmoidTanhTanh: 0.000100 0.90

Deep learning 如何获取暹罗网络的CAM（类激活图）？

标签： Deep Learning

如何获取暹罗网络的CAM（类激活图）？暹罗网络是这样的： class BiDateNet(nn.Module): def __init__(self, n_channels, n_classes): super(BiDateNet, self).__init__() self.inc = inconv(n_channels, 64) self.down = down() self.up = up() sel

Deep learning 从Google Colab的驱动器获取文件夹

标签： Deep Learning Path Google Colaboratory

我试图在jupyter笔记本上运行一个深度学习模型，这需要花费很长时间，而且karnel在训练中死亡。所以我试着在Google Colab上运行它。我学到了一些互联网上的基本知识，但这对我一点帮助都没有。模型从模块中获取数据集，此链接具有从本地计算机提取和预处理数据集以进行trining的模块。我已经在Gdrive中上传了数据集，现在我想更改路径，以便此模块找到“数据集”文件夹。我已经坚持了5天，现在我不知所措。我建议您不要直接将数据集从GDrive加载到colab。它增加了数据集加载时间 G

Deep learning 将jpg文件转换为png是否会丢失信息？

标签： Deep Learning pngjpeg

我正在使用深度学习进行图像数据集的分割。训练图像和遮罩采用jpg格式。我想知道在将jpg转换为png时是否会丢失信息？我搜索了一下，但找不到任何相关信息。我正在尝试使用png图像是否可以提高分割精度。非常感谢您的帮助。PNG默认使用无损压缩但是，PNG标准支持许多不同的位深度、颜色空间和可能导致信息丢失的漂亮特性。例如，如果使用24位颜色的标准JPEG文件并将其转换为8位颜色的PNG，则会丢失图像信息在库（如OpenCV或PIL）中使用默认设置时，转换将是无损的。Ok。谢谢你的回答。我转换了

Deep learning 关键词提取与基于关键词的文本分类

标签： Deep Learning keywordfeature-extractiontext-classificationkeyword-extraction

目前我正在做一个项目，需要提取关键字，或者我们可以说是基于关键字的文本分类。数据集包含3列文本、关键字和cc术语，我需要从文本中提取关键字，然后根据这些关键字对文本进行分类，数据集中的每一行都有自己的关键字，我想提取类似的关键字。我想通过提供文本和关键字列来训练，以便模型能够提取未知文本的关键字。请帮助关键字提取通常使用设置分数阈值即可完成。在训练分类器时，在某个阈值处切断关键字没有多大意义，因为知道某些不太可能是关键字的内容也可能是分类器的有价值信息获取特定单词的TF-IDF分数的最简单方

Deep learning 为什么小权重有助于深层神经网络（正则化）

标签： Deep Learning Neural Network Artificial Intelligence

我一直在学习神经网络很长时间，我实际上被这个叫做正则化的主题困住了。我学习了L1、L2正则化技术，该技术的主要目的是使权重尽可能小。但我还是不明白为什么这很有用。我实际上是在看这本书-这本书不是从理论方面而是从实践方面很有帮助神经网络的权值通常存储为16位或32位浮点数。对于深度神经网络，如果不向反向传播中添加正则化项，它们的权重将增加到超过浮点数可以很好地表示的值（无穷大），或者变得非常小，以至于它们都表示为零，神经网络将不再起作用这就是所谓的消失或爆炸梯度问题。向成本函数中添加权重之和，

Deep learning Tensorflow的净重是否可用？

标签： Deep Learning Tensorflow

当我从git克隆AlexNet的基准时，它是Tensorflow存储库的一部分。基准测试实现了这些层，但在我看来，AlexNet的实际权重在任何时候都没有加载我很想使用Tensorflow，但我的应用程序（在caffe中）使用的是经过预培训的AlexNet 你认为他们也会释放砝码吗？我不知道现有的砝码，但有人写了一个，你可以找到（另请参见）。我不能保证它会起作用，但你很有可能把这两个粘在一起，得到你想要的东西。不，基准文件只是实现，你必须训练和评估在AlexNet上训练权重的numpy数组。您

Deep learning 通过Keras中的残差跳过两个卷积网络

标签： Deep Learning conv-neural-networkresnet

我想知道如何连接卷积层以形成残差。这是我的VGG16： #Initialising the CNN cls=Sequential() #adding 1st Convolution2D layer cls.add(Convolution2D(64,(3,3),strides=1,border_mode='same',activation='relu',input_shape=(120,120,1))) cls.add(Convolution2D(64,(3,3),strides=1,borde