Machine Learning_IT技术博客_编程技术问答

Machine learning 偏倚在神经网络中的作用是什么？

标签： Machine Learning Neural Network Artificial Intelligence backpropagation

我知道梯度下降和反向传播算法。我不明白的是：什么时候使用偏见是重要的，你如何使用它例如，当映射和函数时，当我使用两个输入和一个输出时，它不会给出正确的权重。但是，当我使用三个输入（其中一个是偏差）时，它会给出正确的权重可以使用两种不同的参数在培训过程中进行调整 ANN，权重和中的值激活功能。这是不切实际，如果只应选择其中一个参数调整。为了解决这个问题偏倚神经元被发明了。偏见神经元位于一层，是连接的下一层的所有神经元，但在上一层中没有，并且总是发射1。因为偏倚神经元发射1

Machine learning 如何评估网页的质量？

标签： Machine Learning Nlp spaminformation-retrieval

我正在做一个大学项目，该项目必须收集并合并用户提供主题的数据。我遇到的问题是，谷歌对许多术语的搜索结果被低质量的自动生成页面所污染，如果我使用这些页面，我可能会得到错误的事实。如何评估页面的质量/可信度你可能会认为“不，谷歌的工程师们已经为这个问题工作了10年，他正在寻求解决方案”，但如果你仔细想想，SE必须提供最新的内容，如果它将一个好页面标记为一个坏页面，用户将不满意。我没有这样的限制，所以如果算法意外地将一些好的页面标记为坏页面，这不会是一个问题下面是一个例子：假设输入是在南洛杉矶购

Machine learning 使用翻转图像进行机器学习数据集

标签： Machine Learning Computer Vision

我有一个二元分类问题。我正在尝试训练一个神经网络来从图像中识别物体。目前我有大约1500张50x50的图片。问题是用水平翻转的相同图像扩展我当前的训练集是否是个好主意？（图像不是对称的）谢谢我想你可以在更大程度上做到这一点，不仅仅是水平翻转图像，而是将图像的角度改变1度。这将为训练集中的每个实例生成360个样本。根据您的算法的速度，这可能是一种非常好的方法，可以确保算法不仅经过训练，能够识别图像及其镜像这可能是个好主意，但我也不知道图像识别的目标或领域是什么。假设图像包含字符，您要求图像识

Machine learning 如何结合不同的NLP功能进行机器学习？

标签： Machine Learning Nlp similarityknnfeature-selection

我正在尝试使用不同的NLP功能进行KNN学习。例如，我想使用单词包和本地POS标签另外，我对如何计算单个特征的相似性有一些想法。比如使用余弦相似度和计数（对于单词包向量），或者使用汉明距离作为POS标记然而，我不知道如何将两者结合起来。这个地区的人们通常是怎么做的？有人能帮我吗提前谢谢我将使用这两种功能的简单线性组合。因此，您可以分别使用余弦相似性和词性标记的汉明距离来比较单词包向量，然后取两种结果的平均值。因此，如果余弦比较和汉明距离的结果如下： rank score cos

Machine learning Weka中文档词频的规范化

标签： Machine Learning weka

在Weka中，类定义了一个名为SetNormalizedOllength的方法。它规范化文档的词频。我的问题是： “规范文档的词频”是什么意思 Weka是怎么做到的一个实际的例子对我最有帮助。提前感谢。查看Weka源代码，这是进行归一化的方法： private void normalizeInstance(Instance inst, int firstCopy) throws Exception { double docLength = 0; if (m_AvgDocLe

Machine learning PCA、LDA和NaiveBaysian

标签： Machine Learning

我试图将线性判别分析应用于两类问题。据我所知，LDA假设这两类具有相同的协方差矩阵，然后用不同的平均值将可能性建模为高斯分布我尝试过的另一个分类器是朴素贝叶斯分类器。它忽略了预测变量之间的任何相关性现在，我不明白对数据集应用PCA时会发生什么。根据其定义，PCA算法旋转数据，使得协方差矩阵是对角的。在旋转过程中没有损失任何东西，但是既然协方差矩阵现在是对角的，那么朴素贝叶斯不应该和LDA一样好，或者更好，因为LDA将有更多的参数需要估计吗？然而，根据我的数据，无论是否使用PCA，Naive

Machine learning 热门项目建议-时间敏感数据-数据挖掘

标签： Machine Learning data-miningtime-seriesclassificationprediction

我是数据挖掘领域的新手。我正在研究一个非常有趣的数据挖掘问题。数据说明如下：数据是时间敏感的。项目属性取决于时间因素及其类标签。我将每周数据分组为训练或测试记录的一个实例。每周，某些项目属性可能会随着其流行程度（即类别标签）而改变一些样本数据如下： IsBestPicture,MovieID,YearOfRelease,WeekYear,IsBestDirector,IsBestActor,IsBestAc‌tress,NumberOfNominations,NumberOfAwards,

Machine learning 分类算法训练集中的错误

标签： Machine Learning Computer Vision classification

我正在寻找一种算法，以建立一个目标检测分类器。分类器将用于通过对象及其特征检测交通场景中的车辆。我已经研究过像boosting和多实例学习这样的算法，但它们似乎不适合我的情况。我有两个数据集，一个是正样本，另一个是负样本，但这些数据集只包含一小部分错误（所有真实世界的数据都会有错误。如果你知道特定的错误，你应该在训练之前过滤它们。捕捉这些错误的最好方法是增量训练你的分类器。每次你添加到语料库并重新训练一个新分类器时，你应该检查精度、召回率和F1。如果新分类器的性能更差，你知道您在工作语料库中添加

Machine learning 机器学习：如何生成输出多变量而不是单变量的回归模型？

标签： Machine Learning regressionmultitasking

给定D=（x，y），y=F（x），似乎大多数机器学习方法只将y作为一个单变量输出，要么是一个标签，要么是一个实值。但我面临的情况是，x向量可能只有5~9维，而我需要y是一个多项式分布向量，可以有多达800维。这使得这个问题非常棘手我研究了很多多任务机器学习方法，在那里我可以同时训练所有这些y_I。当然，另一个愚蠢的方法是，我也可以单独训练所有这些维度，而不考虑任务之间的联系。但问题是，在回顾了许多论文之后，似乎大多数MTL实验只处理10~30个任务，这意味着800个任务可能会很疯狂，训练起来很

Machine learning 基于k-means的人脸表情分类

标签： Machine Learning data-miningface-detectionfeature-detection

我使用k-means对面部表情进行分类的方法是：使用opencv检测图像中的人脸使用ASM和stasm获取面部特征点计算面部特征之间的距离（如图所示）。将有5个距离计算每个面部表情的每个距离的质心（例如：在距离D1中，每个表情“高兴、生气…”有7个质心）使用5个k-均值，每个k-均值对应一个距离，每个k-均值的结果是，第一步计算的最接近质心的距离所示的表达式最终表达式将是出现在most k-means结果中的表达式然而，用这种方法我的结果是错误的吗？我的方法是对的还是错的 K-m

Machine learning 在支持向量机中使用核函数会增加过度拟合的可能性吗？

标签： Machine Learning

在支持向量机中使用核函数划分非线性区域时，我们根据训练实例引入了新的特征。然后，我们将提供与培训示例一样多的功能。但拥有尽可能多的功能会增加过度装配的可能性，对吗？我们应该放弃一些新功能吗？增加功能确实会增加过度拟合的机会，可能是您应该使用交叉验证（libsvm包含）策略来测试您现在训练的模型是否过度拟合，并使用功能选择工具选择功能您确实无法删除任何内核生成的功能，在许多情况下，您不知道正在使用哪些功能或赋予它们什么权重。除了使用核函数外，支持向量机还使用正则化，这种正则化降低了过度拟合的可能

Machine learning 将prop文件转换为arff文件

标签： Machine Learning Nlp weka Stanford Nlp

我正在用于NLP相关的任务。但我也需要尝试其他的机器学习算法。因此，我想将道具文件转换为arff或打印特征，然后转换为arff文件。一个主要问题是分类器工具输出的特征是稀疏表示（仅显示存在的特征）。如何实现这一点？ARFF有一种格式。它与非稀疏ARFF文件非常相似，但值为0的数据不能显式表示稀疏ARFF文件具有相同的头（即@relation和@attribute标记），但数据部分不同。而不是按顺序表示每个值，如下所示：非零属性由属性编号及其值明确标识，如下所示：注意关于arff稀疏格式的问

Machine learning 为什么要使用交叉验证？

标签： Machine Learning Artificial Intelligence cross-validationkaggle

我正在参加几场Kaggle机器学习比赛，我有一个简短的问题。为什么我们要使用交叉验证来评估我们的算法在这些竞争中的有效性当然，在这些竞赛中，您在公众排行榜上的得分（在该排行榜上，您的算法将根据实际的实时数据进行测试）将为您提供更准确的算法效能表示？交叉验证是构建模型的必要步骤。如果交叉验证的结果很差，那么即使在实时数据上尝试也没有意义。您正在培训和验证的数据集也是实时数据，不是吗？因此，结果应该是相似的。如果不验证您的模型，您就无法洞察其性能。在训练集上给出100%准确度的模型可以在验证集上给

Machine learning 在这种情况下，如何构建决策树？

标签： Machine Learning decision-tree

在我的应用程序中，我有项s 项已基本名称（剑、盾等）稀有品（普通、魔法、稀有、独特）从400个左右的池中取出最多6个MOD（可以减少，因为很多MOD不常见或无用）。大多数MOD的值为（+100至最大寿命）。一件物品的价值在很大程度上也取决于这些价值，而不仅仅是mod的存在代价我的目标是输入一个项目并得到一个价格估算不确定如何为此构建决策树，特别是因为有大量的mod 我曾想过这样的事情，但我想，即使在修剪之后，也会有一棵疯狂的大树有没有关于如何构建这棵树的建议，让我能够预测商品

Machine learning 如何计算SARSA的资格跟踪？

标签： Machine Learning reinforcement-learningsarsa

我正在尝试实现资格跟踪（前瞻性），其伪代码可以在下图中找到我不确定对于所有的s，a意味着什么（下面第5行）。他们从哪里获得s，a的集合如果是前瞻性的，是否从当前状态向前循环以观察s' 您是否调整了每个e（s，a）？不幸的是，他们在两个不同的范围内重复使用了变量s和a，但是是的，您调整了所有e（s，a）值，例如 for every state s in your state space for every action a in your action space u

Machine learning 机器学习中的Logistic回归

标签： Machine Learning logistic-regression

我正在研究机器学习中的“逻辑回归”主题。我可以理解它试图最大化属于特定类标签的实例的可能性的整个概念如果运行多次迭代，该算法将找到一个分离实例的权重向量，然后不断增加权重向量的大小。我不明白为什么它会试图增加权重向量的大小任何帮助都是非常值得的我认为你所问的是机器学习中的正则化，从我的理解来看，这样做是为了避免过度拟合现象，即假设几乎完全符合训练数据，而代价是对测试数据给出一个糟糕的假设我希望这在某种程度上有所帮助。我猜你的数据是线性可分的？IIRC，逻辑回归在这种情况下失效。我认为这是

Machine learning 穷举信道/特征选择中的降维

标签： Machine Learning pcadimensionality-reduction

我的数据由16channelsx128个样本x400个试验组成。我想在此数据集中执行详尽的频道选择。我应该在哪里申请PCA unsortedChannelIndices = [1:16] sortedChannelIndices = []; %Option 1 reducedData = PCA(data, classIndeces) for chIdx = 1:length(unsortedChannelIndices) for c=1:length(unsortedChannel

Machine learning 梯度下降值不正确

标签： Machine Learning gradient-descent

我正在尝试使用以下代码实现梯度下降：我已将代码修改为以下内容： X = [1; 1; 1;] y = [1; 0; 1;] m = length(y); X = [ones(m, 1), data(:,1)]; theta = zeros(2, 1); iterations = 2000; alpha = 0.001; for iter = 1:iterations theta = theta -((1/m) * ((X * theta) - y)' * X)

Machine learning Spark K-折叠交叉验证

标签： Machine Learning classificationapache-spark-mllibcross-validation

我在理解Spark的交叉验证时遇到了一些问题。我见过的任何一个例子都使用它进行参数调整，但我假设它也会进行常规的K倍交叉验证我想做的是执行k倍交叉验证，其中k=5。我想得到每个结果的准确度，然后得到平均准确度。在scikit中，了解这是如何完成的，分数将给出每次折叠的结果，然后您可以使用分数。mean（）我在Spark中就是这样做的，paramGridBuilder是空的，因为我不想输入任何参数 val paramGrid = new ParamGridBuilder().build()

Machine learning 在不同时间为CNN提供数据

标签： Machine Learning Tensorflow

我现在正在学习机器学习，我有一个问题，我们可以在不同的时间将数据输入神经网络，例如，今天我有10000张图像来训练一个图像识别神经网络，我得到一个带权重1和偏差1的神经网络，明天，我再得到100张图像，我想在旧的神经网络的基础上训练神经网络这可能吗我认为这是人类认知的自然方式非常感谢致以最诚挚的问候是的，例如搜索“在线学习”是可能的，在在线学习中，当新数据出现时，您可以进行增量培训。对于tensorflow，您可以保存/加载您的模型，并在加载后进行训练。是的，例如，在在线学习中搜索“

Machine learning 如果假阳性和真阴性之和为零，如何计算假阳性率（FPR）？

标签： Machine Learning rocfalse-positive

我正在进行性能测量，并试图绘制ROC曲线，但要绘制ROC曲线，我需要TPR和FPR 我们知道, 假阳性率（FPR）=FP/（FP+TN）我得到的TN和FP的值都等于0，那么我如何计算这种情况下的FPR并放入ROC曲线中呢首先假阳性率（FPR）=FP/（FP+TN）因此我得到了TP和FP的值都等于0 这不是一个问题，因为在这个等式中没有使用TP。唯一的问题是FP+TN为0，但这是不可能的，因为FP+TN=阴性（所有带有阴性标签的样本，无论您如何分类）。因此，如果您的数据集没有负样本，那么

Machine learning 如何检测textsum训练是否过度拟合？

标签： Machine Learning Tensorflow Deep Learning textsum

我正在使用Tensorflow 0.9并使用Textsum模型进行训练。我收集了大约130万篇文章，并且已经针对它们进行了大约一周的训练。平均损失约为1.75-2.1。我决定停止并运行eval，因为我的理解是，我的平均损失应该接近我在训练中得到的。当我进行评估时，我看到了2.6到2.9的平均损失。我只是想知道在执行此运行时应该看到什么我是否正确使用此培训/评估分析？我对深度学习有点陌生，试图以此作为一种学习方式，通过一些其他阅读，这似乎是两者之间的一个很大的差异是否有针对不同数据集进行评估的

Machine learning 什么是交叉熵？

标签： Machine Learning cross-entropy

我知道有很多关于交叉熵的解释，但我还是很困惑这只是描述损失函数的一种方法吗？我们能用梯度下降算法用损失函数求最小值吗？交叉熵常用于量化两个概率分布之间的差异。在机器学习的背景下，它是分类多类分类问题的误差度量。通常，“真实”分布（机器学习算法试图匹配的分布）表示为一个热分布例如，假设对于一个特定的训练实例，真正的标签是B（在可能的标签a、B和C中）。因此，此培训实例的一个热点分布是： Pr(Class A) Pr(Class B) Pr(Class C) 0.0

Machine learning 在未知测试集上使用Select-K-best

标签： Machine Learning Scikit Learn feature-engineering

我在sklearn中培训了逻辑回归分类器。我的基本要素文件有65个要素，现在我通过考虑二次组合（使用PolynomialFeatures（））将它们外推到1000。然后我用Select-K-Best（）方法将它们减少到100 然而，一旦我对模型进行了培训并获得了一个新的test_文件，它将只包含65个基本特性，但我的模型预计会有100个因此，当我不知道Select-K-Best.fit（）函数中所需的标签时，如何在测试集上应用Select-K-Best（）方法您不应该在测试数据上再次拟合Sel

Machine learning TensorFlow 1.2.1和InceptionV3对图像进行分类

标签： Machine Learning Tensorflow Neural Network Keras coreml

我正在尝试使用谷歌最新版本TensorFlow中构建的Keras创建一个示例。这个例子应该能够对大象的经典图像进行分类。代码如下所示： # Import a few libraries for use later from PIL import Image as IMG from tensorflow.contrib.keras.python.keras.preprocessing import image from tensorflow.contrib.keras.python.keras.

Machine learning 用于网站分类的简单机器学习

标签： Machine Learning Artificial Intelligence classificationcross-validationtext-classification

我正在尝试生成一个Python程序，确定网站是否有害（色情等）首先，我制作了一个Python web抓取程序，它统计每个单词出现的次数这是一个键值字典，就像 {word:[#出现在有害网站中，#包含这些词的网站]} 现在我想让我的程序分析来自任何网站的文字，以检查网站是否安全。但我不知道哪种方法适合我的数据。您尝试的是情绪分类，通常使用递归神经网络（RNN）或长-短期记忆网络（LSTM）进行。从机器学习开始，这不是一个容易的话题。如果你是新手，你应该先研究线性/逻辑回归、支持向量机和基本神

Machine learning 如何仅根据列表的标题向用户推荐标签？

标签： Machine Learning Nlp

问题是：我只需要根据用户即将创建的列表的标题（5-15个单词）向用户推荐标签我们有大约30个预先确定的标签- Gaming, Movies, TV shows, Documentaries, Books, Music, Art, History, People, Adventure, Sports, Cooking, Travel, Places, Food, Drinks, Fitness, DIY, Technology, Science, Cars, Bikes, Comedy, Sh

Machine learning 二元分类的Tensorflow单sigmoid输出和两个线性输出（具有稀疏softmax交叉熵损失）

标签： Machine Learning Tensorflow classification

我正在TensorFlow中试验二进制分类器的实现。如果我在最后一层有两个普通输出（即无激活），并使用tf.loss.sparse\u softmax\u cross\u entropy，我的网络将按预期训练。但是，如果我更改输出层以生成带有tf.sigmoid激活的单个输出，并使用tf.loss.log_loss作为损耗函数，则我的网络不会训练（即损耗/精度不会提高）以下是我的输出层/损耗函数在第一种（即工作）情况下的样子： out=tf.layers.density（上一页，2）损耗=t

Machine learning 基于语音的情感识别

标签： Machine Learning voice

通过对一个人的语音进行音调分析，获得该人的情绪的方法是什么？我可以找到很多关于这个主题的研究论文，但似乎除了向有限制的用户提供的许多封闭源代码API之外，还缺少显示实现的程序这种方法可行吗？这项任务可能面临哪些问题？我不是音频分析专家，但我在这方面有一些经验。从语音中识别情感的过程与每个分类任务中的过程非常相似。你必须从演讲中提取情感特征，然后进行分类。有可用的数据库和音频分析库。您可以使用它们来构建数据集 3年前，我使用它来区分愤怒的言论和不愤怒的言论。我还通过互联网搜索了可用的API，虽然

Machine learning k-质心如何选取新质心？

标签： Machine Learning cluster-analysisdata-mining

我对K-质心的理解是，质心是从现有点随机选取的。通过将剩余点除以最近的质心来计算簇。计算误差（绝对距离） a）如何拾取新质心？从示例中可以看出它们是随机选取的吗？再次计算误差，看看这些新的质心是好是坏 b）你怎么知道你需要停止拾取新的质心？值得一读k-medoid算法的原理。关于第一步随机选择的n数据点的kmedoid，您是对的通过交换循环中的每个medoidm和每个非medoido并再次计算距离，可以拾取新的medoid。如果成本增加，则撤消交换如果没有交换整个迭代，算法将停止。选择初

Machine learning 为什么深剩余网络中的每个块都有两个卷积层而不是一个？

标签： Machine Learning Deep Learning conv-neural-networkdeeplearning4jdeep-residual-networks

此图显示剩余网络的基本块。什么有两个卷积层？当它只有一个卷积层时会发生什么情况？它应该仍然可以使用类似的结果。只跳过一层没有问题看丹塞涅茨呢

Machine learning 预测y后下一步做什么？

标签： Machine Learning regressionlinear-regression

我已经对数据集进行了预处理，并检查了自变量可能存在的多重共线性数据集有6列31行，我用来生成1/3的X_测试和y_测试，剩下的是X_序列和y_序列我使用sklearn.linear\u模型线性回归函数将X_序列和y_序列拟合到回归器，并使用X_测试的预测函数，该函数给出y的预测值 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importi

Machine learning Keras CNN参数太少

标签： Machine Learning Neural Network Keras keras-layerconvolutional-neural-network

我试图用3个输入和keras中的sigmoid激活函数重新创建以下教程CNN：因此，参数的数量应为7（假设1个大小为2的过滤器在2个位置上卷积（顶部2个输入或2个较低的输入），2个共享权重（在突触上显示为1.0），conv1d层中没有填充）。当我用Keras写下以下内容时：当我在model.summary（）中检查它时，我只得到5个参数：我需要做什么才能获得正确数量的参数？由于我是Keras的新手，我的代码中可能有几处错误。所有卷积参数都是在空间上共享的（在1D的情况下，这意味着整个

Machine learning 基于tflearn的回归神经网络

标签： Machine Learning Neural Network classificationregressiontflearn

我的问题是关于编码一个使用tflearn进行回归（而不是分类）的神经网络数据集： fixed acidity volatile acidity citric acid ... alcohol quality 7.4 0.700 0.00 ... 9.4 5 7.8 0.880 0.00 ... 9.8 5 7.8

Machine learning 方程在“；进化策略作为强化学习的可扩展替代方案”；衍生的？

标签： Machine Learning reinforcement-learningevolutionary-algorithm

在OpenAI的论文《进化策略作为强化学习的可伸缩替代品》中，第3页中的等式是如何推导出来的它不是“衍生”的，因为这个方程不是论文中先前方程的自然级数这个公式演示了作者如何选择应用随机梯度上升。这是他们使用的算法的数学表示在这个等式的正下方，他们解释了它是如何工作的：生成的算法重复执行两个阶段：1）随机扰动策略参数并评估通过在环境中运行事件生成的参数，以及 2）结合这些事件的结果，计算一个随机变量梯度估计，并更新参数从一开始就重新开始，慢慢地仔细阅读，可能会有所帮助。如果你遇到

Machine learning 多训练集LSTM RNN

标签： Machine Learning Neural Network Keras lstmrnn

我正在尝试训练LSTM RRN，但我遇到了一个问题，即我有多组顺序数据。是否有一种方法来准备数据，而不是将数据全部发送到一起，以便正确地训练模型，或者我必须接受数据集之间会有一些错误的重叠。您能提供一些示例来说明您试图实现的目标吗？不清楚。是的，对不起，这可能是个糟糕的问题，因为我是新来的。因此，我正在对歌曲进行RNN训练，但如果我以一个长序列将它们输入到模型中，训练中会出现小错误，因为一首歌曲的结束不会影响下一首歌曲的开始

Machine learning 在Weka中-不规范化所有数值属性

标签： Machine Learning wekanormalizationfeature-selectionnormalize

我正在使用WEKA处理KDD99数据集。数据集中有三种类型的属性，即标称属性、二进制属性和数字属性。但在WEKA中，它也将二进制数据视为数字我尝试使用无监督的属性规范化工具来规范化数据。然而，它也规范化了二进制数据。我这里有两个问题我需要规范化二进制属性吗？因为二进制数据是不连续的如果我不需要规范化二进制属性，在WEKA中，如何在规范化工具中选择属性？因为规格化工具始终应用于所有数值属性（包括二进制属性）谢谢 Weka已将输入文件中的二进制属性解释为数字，因为它们的值都是数字（即0和1）

Machine learning 自动编码器中使用的纪元数取决于数据集的维度？

标签： Machine Learning autoencoder

我开发了一个简单的自动编码器，为了找到正确的参数，我使用网格搜索数据集的一小部分。输出中的历元数可用于维度更高的训练集？纪元的数量取决于数据集的维度？还是不？例如，我在一个维度较大的数据集中有更多的纪元，而在一个较小的数据集中，纪元数较少。一般来说，如果数据集较大，纪元数会发生变化时代的数量不应该预先决定。您应该运行培训，并随时间监控培训和验证损失，并在验证损失达到平台或开始增加时停止培训。这种技术被称为“提前停止”，是机器学习中的一种很好的实践。通常是的，如果数据集较大，则纪元的数量会发生变

Machine learning 这是不是太合适了？

标签： Machine Learning

我有一个CNN，它在训练数据上表现很好（96%准确率，1.~损失），但在测试数据上表现很差（50%准确率，3.5损失） 96%的准确率表明你与训练数据非常接近。测试数据的50%准确率表明，您的模型无法解释所研究数据的噪声/可变性。这看起来像是教科书上的过度装修您似乎将验证数据称为测试数据。也许您可以更好地对数据进行分区？96%的准确率表明您与培训数据非常接近。测试数据的50%准确率表明，您的模型无法解释所研究数据的噪声/可变性。这看起来像是教科书上的过度装修您似乎将验证数据称为测试数据。也

Machine learning MAPE损失函数相对于MAE和RMSE的优势

标签： Machine Learning Math Statistics

我正在读这篇文章：他在这里解释了五个损失函数之间的区别：第一个问题是我们如何衡量成功？我们通过一个损失函数，我们试图最小化损失函数。有有几种损失函数，它们有不同的优点和缺点我设法理解了前两个损失函数： MAE（平均绝对误差）-这里所有的误差，无论大小，都被同等对待均方根误差（RMSE）-这将惩罚由于平方项而产生的较大误差。例如，如果出现错误[0.5,0.5]和[0.1,0.9]，两者的MSE均为0.5，而RMSE为0.5和。0.45 但我不明白第三个： MAPE（平均绝对百分比误差）

Machine learning 是否应从Rasa NLU培训数据中删除标点符号？

标签： Machine Learning Nlp rasa-nlupunctuationrasa

在NLU培训数据中，是否应该保留、删除或根本不重要的话语中的标点符号（逗号、撇号、问号、大写字母等）？培训数据可以保留标点符号，并且空白标记器（）将清理它。但并不是所有的标点符号都被清除了！您可以在上看到标记器中使用的正则表达式因此，对于您提到的标点符号，如逗号、撇号、问号等，您可以将其保留在那里，标记器将处理它。您应该删除问题中的特殊字符等

Machine learning 随机森林-最大特征

标签： Machine Learning Scikit Learn random-forest

我确实有一个问题，我需要你的支持。我有一个我正在分析的数据集。我需要预测一个目标。为此，我进行了一些数据清理，其中包括高度下降（线性相关feautes）在准备好数据后，我应用了随机森林回归器（这是一个回归问题）。我有点结巴，因为我真的无法理解max\u功能的含义和价值我找到了下面的一页，上面写着 features=n_回归功能是scikit的一个错误。RF的原始论文给出了回归的最大特征=n特征/3 如果我使用max_features=sqrt（n）或max_features=n_featur

Machine learning 如何使用精度和召回值获得混淆矩阵和准确率？

标签： Machine Learning confusion-matrixprecision-recall

使用for算法，我的平均精度为82.59，召回率为69.84。我需要有人帮助我计算TN、FP、FN和TP，使用来评估方法的性能。精密度与方法的准确度相等吗？如果没有，我如何计算？该分割方法应用于1131幅图像，并与地面实况相比较。我不太确定混淆矩阵在MATLAB中是如何排列的，但在Python中，从sklearn.metrics导入的混淆矩阵是这样排列的： from sklearn.metrics import confusion_matrix confusion_matrix(groun

Machine learning Keras模型预测和预测ANN二元分类的类

标签： Machine Learning Keras classification

我正在Keras中进行ANN二元分类，模型的末尾有一个S形层。样本是否使用基于sigmoid函数的概率（由模型预测生成）分配类（使用预测类）？我的意思是，当概率0.5？你在预测二元分类中的概率。默认情况下，阈值为0.5，这意味着低于0.5的概率属于0类，而其他概率属于1类但有时数据科学家会提高或降低阈值。例如，如果你想发现恶性肿瘤，最好是错误地认为有一个肿瘤你可以阅读有关预测和回忆的文章

Machine learning Tensorflow联邦图像分类示例#时代具有重大影响。模型是否过合适？

标签： Machine Learning Deep Learning tensorflow-federated

我一直在尝试用TF Federated描述图像分类联合学习笔记本教程中的学习过程（准确性和损失）通过修改epoch超参数，我看到了收敛速度的重大改进。从5、10、20等阶段开始改变，但我也看到了训练准确性的大幅提高。我怀疑过度拟合正在发生，尽管当时我对测试集的评估精度仍然很高不知道发生了什么事我的理解是，历元参数控制每轮训练中每个客户的前/后道具。这是正确的吗？因此，ie对10个客户进行10轮10个时代的培训将是10个时代X 10个客户X 10轮。意识到需要更大范围的客户等，但我预

Machine learning RNN的注意机制

标签： Machine Learning Neural Network recurrent-neural-networksentiment-analysisattention-model

我试图设计一个rnn模型来进行情绪分析。因此RNN可以预测giventext的情绪（消极、中性、积极、混合）。该模型使用RNN对给定的单词序列进行迭代，并从最终隐藏状态预测情感。对于情绪分类任务，这种架构有哪些缺点？我将如何使用注意机制改进这种架构例如： “这是一个大雪天。交通事故很多。至少孩子们看起来是这样。快乐。” “昨天是糟糕的一天。我的闹钟睡过头了，更糟的是，我的狗吃了我的作业。至少我的狗看起来很开心。。。“是关于RNN中注意机制的使用，因此它可能对您有所帮助。但是我想知道你为什么不

Machine learning 准确度为97.55%是否表示型号过配？

标签： Machine Learning logistic-regressionevaluation

我已经在预测高风险索赔方面实施了逻辑回归模型。我的模型的准确率是97%。这是否表明我的型号安装过度训练集中的精度不足以进行过度拟合。您正在使用验证集吗？如果您不使用它，您应该将数据集分为三部分：验证集、测试集和培训集。在培训期间，您应该使用培训和验证集。如果训练集的精度较高，而验证集的精度较低，则表示模型拟合过度基于如此少的信息，不太可能回答模型是否拟合过度。你至少应该告诉你在训练中每个班有多少个数据点，你是否使用了一个单独的tets集，如果使用了这个测试集，模型在这个测试集上的结果是什么。

Machine learning 利用事件报告的文本分析预测下周的事件

标签： Machine Learning Nlp data-science

我想做一个项目，但我不确定它是否真的可行，也不知道我应该走哪条路来尝试解决这个问题我有一个数据集，包含来自不同地方的大量事件及其风险分类。例如： Incident: "John stumbled and fell down the stairs" Risk: Severe Warehouse: A Date: 2020-07-11 --- Incident: "Mary left the door open" Risk: Low Wareh

Machine learning 使用cross_val_score（）的正确方法是什么

标签： Machine Learning Scikit Learn cross-validation

考虑这样的函数调用：cross\u val\u score（model，X，y，cv）在调用这个函数之前，我已经用DecisionTreeClassifier（）.fit（）对一个模型进行了训练，我们称它为trained\u model 我有以下问题：模型：我应该向该参数传递什么DecisionTreeClassifier（），DecisionTreeClassifier（）.fit（）或训练型当我构建训练的\u模型时，我已经为分类器设置了随机的\u状态，并且训练测试\u分割（）。我是否应

Machine learning 为每个特征训练单独的多变量RNN，以便进行多步预测

标签： Machine Learning Neural Network time-seriesrecurrent-neural-networkforecasting

我正在处理一组小的时间序列（实际上所有的时间序列都在不同的地方测量相同的东西），我想使用所有的时间序列作为输入，对所有的时间序列进行多步预测我相信任何错误都会随着时间的推移而严重放大，但大多数预测都是如此。我只是希望预测在质量上看起来“正常” 那么，这种方法有什么根本性的错误吗？（我将对许多架构/培训方法进行润色，因为这与我的问题无关）对于每个时间序列，使用所有时间序列作为输入，对RNN进行训练以预测下一个值。训练后，RNN集用于迭代预测每个时间序列t+1处的值这似乎幼稚/错误。有人能告诉