Python 如果给定一个输入向量或一系列向量,是否可以使用XGBoost预测整个输出向量?

Python 如果给定一个输入向量或一系列向量,是否可以使用XGBoost预测整个输出向量?,python,python-3.x,algorithm,machine-learning,nlp,Python,Python 3.x,Algorithm,Machine Learning,Nlp,我有文本评论和答案的文本数据集。评论和答案中的每一句都被矢量化如下: Vector_Review Answer_Vector 0 [1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1] [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 1 [1, 0, 0, 0, 0, 0, 0, 0, 0,

我有文本评论和答案的文本数据集。评论和答案中的每一句都被矢量化如下:

                    Vector_Review                                       Answer_Vector
0   [1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1]   [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
1   [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]   [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
2   [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]   [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
3   [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0]   [0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
4   [1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0]   [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
我已经编好了向量来举个例子,我知道它们不符合预期,但是想象一下复习向量和答案向量匹配

这些句子的向量是根据从评论/答案文本中提取的构建词汇集,使用
one hot
匹配创建的。当评论关键字出现在其答案上时,它将是1,如果不是,则为0

现在我想提出几个问题。假设每个审查向量与其对应的答案向量相关联:

  • 有没有一种方法可以预测一个新的复习向量下的整个答案向量
  • 是否有任何ML算法可以接受这样的输入向量并输出新向量
  • XGboost或任何其他现有算法是否可能实现这一点
  • 使用神经网络是否可能/更好
  • 如果不是的话,解决这个问题的最佳方法是什么

提前非常感谢

我将把所有问题的答案总结为一个问题:

给定一个输入文本,您可以使用统计分布和推断的语法和语义来预测第二个文本

最近,Seq2Seq模型在这方面取得了很大成功

总之,seq2seq是一个由编码器和解码器组成的神经网络模型(通常在递归神经网络(RNN)的基础上制作)。通常,这是基于嵌入的,但似乎将一个热门编码转换为嵌入并不困难

由于使用了所谓的注意机制(和Google BERT),该模型出现了几次爆发

因此,这通常最好使用人工神经网络

以下是一些参考资料:

  • 伯特:

  • Seq2Seq:

  • 注意:

  • RNN:


非常感谢Tiago。这正是我需要的方向。我对NLP很陌生,我想知道在预测另一个文本序列的文本序列时,哪种方法可能是最好的方法。我来看看你的建议。我希望这能帮我实现我的目标:)