Web scraping 文本挖掘基本问题

Web scraping 文本挖掘基本问题,web-scraping,data-mining,text-mining,sentiment-analysis,Web Scraping,Data Mining,Text Mining,Sentiment Analysis,文本挖掘特定问题: 我来自汽车行业的一个CRM领域,我们有很多非结构化的调查数据。第一个问题是-是否有一个特定于领域的词典可以用来映射情绪分析的积极和消极词汇?如果是,请帮我 在进行情绪分析时,我们如何处理“不坏”和“不好”等词。“不坏”本质上意味着“好”,但会被打负分 我们如何处理重要单词附近的单词。例如,“没有帮助”和“非常有帮助”应该被给予正负分,因为这里重要的是围绕“有帮助”一词的“没有”和“非常”。有人称这种方法为“意见挖掘”。这是如何在r&C中发生的?请注意这些场景 任何人的帮助都将

文本挖掘特定问题:

  • 我来自汽车行业的一个CRM领域,我们有很多非结构化的调查数据。第一个问题是-是否有一个特定于领域的词典可以用来映射情绪分析的积极和消极词汇?如果是,请帮我

  • 在进行情绪分析时,我们如何处理“不坏”和“不好”等词。“不坏”本质上意味着“好”,但会被打负分

  • 我们如何处理重要单词附近的单词。例如,“没有帮助”和“非常有帮助”应该被给予正负分,因为这里重要的是围绕“有帮助”一词的“没有”和“非常”。有人称这种方法为“意见挖掘”。这是如何在r&C中发生的?请注意这些场景

  • 任何人的帮助都将受到感激

  • 可能很少有基于上下文的语料库包含好的和坏的关键词,但这些并不是为所有数据集量身定做的。在某些情况下,结果可能非常令人失望。对于这类问题,我建议您采用机器学习的方法。你可以应用很多分类技术,我建议你试试朴素贝叶斯、支持向量机,如果你有时间的话,还可以做基于文本的CNN(有点棘手,但非常准确)。同样,上述所有模型都将严重依赖于您的训练语料库。其中一个例子是可用的

  • 二,三。尝试构建依赖树,斯坦福解析器在句子语法分析方面做得很好。例如,当我试图用

    “我不喜欢自助餐,相反,我会点一份非常美味的自助餐 经济的”

    从上面的输出我们可以得到,情感词“like”被否定词“not”修饰。此外,“经济型”一词由副词“非常”限定。 有超过50种关系,你只需要担心4或5种情绪分析。这将有助于解释这些关系是什么。 您可以使用他们的API

  • 可能很少有基于上下文的语料库包含好的和坏的关键词,但这些并不是为所有数据集量身定做的。在某些情况下,结果可能非常令人失望。对于这类问题,我建议您采用机器学习的方法。你可以应用很多分类技术,我建议你试试朴素贝叶斯、支持向量机,如果你有时间的话,还可以做基于文本的CNN(有点棘手,但非常准确)。同样,上述所有模型都将严重依赖于您的训练语料库。其中一个例子是可用的

  • 二,三。尝试构建依赖树,斯坦福解析器在句子语法分析方面做得很好。例如,当我试图用

    “我不喜欢自助餐,相反,我会点一份非常美味的自助餐 经济的”

    从上面的输出我们可以得到,情感词“like”被否定词“not”修饰。此外,“经济型”一词由副词“非常”限定。 有超过50种关系,你只需要担心4或5种情绪分析。这将有助于解释这些关系是什么。 您可以使用他们的API