Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/300.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 结合文本和;R中的范畴列_Python_R_Text Classification - Fatal编程技术网

Python 结合文本和;R中的范畴列

Python 结合文本和;R中的范畴列,python,r,text-classification,Python,R,Text Classification,我有一个IT运营票证数据集,其中包含票证编号、描述、类别、子类别、优先级等字段 我需要做的是使用可用数据(票号除外)预测票的优先级。样本数据如下所示 Number Priority Created_on Description Category Sub Category 719515 MEDIUM 05-01-2016 MedWay 3rd Lucene.... Server Change 720317 MEDIUM 07-01-201

我有一个IT运营票证数据集,其中包含票证编号、描述、类别、子类别、优先级等字段

我需要做的是使用可用数据(票号除外)预测票的优先级。样本数据如下所示

Number  Priority Created_on Description               Category     Sub Category
719515  MEDIUM  05-01-2016  MedWay 3rd Lucene.... Server       Change
720317  MEDIUM  07-01-2016  DI - Medway 13146409  Application  Incident
720447  MEDIUM  08-01-2016  DI QLD Chermside....  Application  Medway

请在这方面指导我

没有更多答案的回答有点困难,这更多的是上下文问题,而不是代码问题。但是这里是我用来开始评估这个问题的逻辑,请记住,它可能涉及编写一些单独的脚本,每个脚本执行任务的一部分

试着把问题分解成更小的部分。没有所有的数据,你无法进行分析,所以从创建数据开始

您的类别和子类别已经列出了每个列表中的所有独特因素,并根据您的系统和业务需求为每个因素创建了一组权重。在创建子类别权重时,请记住它们将如何与类别(+/-以及大小)交互

写一个脚本来阅读描述,数一数所有不重要的单词。为单词创建某种类型的分类,以帮助您构建列表,这些列表将使用类别和子类别通知模型。 该值是一条错误消息,还是机器名,或者其他一些代码,或者您可以使用关键字提取的问题类型

所有的单词分组有什么意义? 公司将如何为决策做出贡献

当你决定这些事情时,考虑一下类别

然后与所有的部分,决定一个模型,建立,测试和完善。我知道这里面没有代码,但数据科学的问题解决部分大部分时间都是在代码之外进行的


你需要自己设计代码。如果你被困在编辑后,我们可以提供帮助。

你的问题非常广泛。请尝试用您遇到的特定问题来加强它。其次,您可以将文本处理到TDM,然后附加分类数据,并将其用于培训您的模型。。。这是我心中的想法,但不确定如何实施。不管怎样,我还是要试一试。同时,我将尝试重新表述这个问题,使其更加简洁。谢谢@sconfluentus。我将尝试一下这种方法。我同意我的问题非常广泛,现在我已经去掉了我稍后会考虑的一部分。我会在这里更新,一旦我有一些进展。不幸的是,由于我没有足够的声誉,我无法推翻你的答案。很好!如果我能找到一种简洁的方式,我会把它写在评论里!