C#-基于单词/语言的个性分析

C#-基于单词/语言的个性分析,c#,facebook-graph-api,C#,Facebook Graph Api,我正试图开发一个C#程序,检索用户在Facebook上的帖子,并根据帖子分析此人的个性。这将意味着分析他的词汇和语言/句子结构,以确定他是什么类型的人。 过分自信、胆小、生气等 然而,我不知道该如何用这些词来分析他的性格。 似乎很难,因为我可以在帖子中同时使用积极和消极的词。 有什么想法吗 您打算完成的工作相当复杂(主要是提供可接受的精度),没有简单的解决方案 我将在你的位置上采取的方法的基本思想: 它只能用于给定的语言(如英语), 你在开发过程中考虑的那个。依靠 将其他语言纳入考虑范围的翻译将

我正试图开发一个C#程序,检索用户在Facebook上的帖子,并根据帖子分析此人的个性。这将意味着分析他的词汇和语言/句子结构,以确定他是什么类型的人。 过分自信、胆小、生气等

然而,我不知道该如何用这些词来分析他的性格。 似乎很难,因为我可以在帖子中同时使用积极和消极的词。
有什么想法吗

您打算完成的工作相当复杂(主要是提供可接受的精度),没有简单的解决方案

我将在你的位置上采取的方法的基本思想:

  • 它只能用于给定的语言(如英语), 你在开发过程中考虑的那个。依靠 将其他语言纳入考虑范围的翻译将影响 它的可靠性很高。需要进行新的“启动分析” 对于你想考虑的每种新语言。<李>
  • 这个开发过程中最重要的部分是数据库,因此您必须将重点放在它的设计、连接性、数据存储/检索等方面
  • 数据库的最低内容:单词列表,它们相关的“值”(胆小、愤怒等),它们在给定值内的重要性(f单词的“侵略性”得到10分中的8分),这个单词具有不同含义的可能性有多大(如上面的评论所示,“病态”可能会得到警告标志以检查确切的上下文),进一步考虑(例如,重复次数如何影响其值)等。此外,还必须包括不同的存储级别(每个帖子、每个用户、每个时间等)
  • 您必须创建一个具有足够适应性和可伸缩性的算法(这里需要大量的更改、改进、添加等)来提供您想要的。我的基本想法是:根据数据库中定义的每个单词的值评估每个帖子(通过单独考虑每个单词、给定单词的重复次数、给定单词的上下文等),也就是说,检查哪些单词值得分析,哪些不值得分析;解析系统不仅能够提取单个单词,而且能够分析上下文(同一句子/段落或不同句子/段落中目标单词前后的单词);设置一些规则以避免“误解”(例如,考虑到行为有攻击性的帖子数量最少,否则就忽略(也许只是幽默);考虑不同类型的帖子所形成的复杂情绪(例如,在3个帖子中发怒+在9个帖子中羞怯=*);等等);总之,它必须能够尽可能准确地将“离散岗位现实”转化为期望的输出(岗位/用户评估)

  • 如前所述,这并不容易。但是,如果你一步一步地做事情,并确保结构具有足够的适应性来允许任何修改/扩展,你可能会得到一个相当可靠的软件(通过了解你可以期望的理想结果是什么,即对所使用的语言类型进行排名;将其外推到真实的人格分析听起来可能太雄心勃勃了)这可能会引起很多人的兴趣。

    Wow首先看起来是一个非常有趣的项目,也是一个好主意,但是你会遇到俚语和这个新术语“太恶心了”的麻烦这是用在好的方面还是用在坏的方面?不过,我对人们的想法很感兴趣。嘿,谢谢。但是我应该如何着手开发算法?这有点新。@SamuelLee这不是一种针对新手的开发。你应该从简单的东西开始。或者,如果你想从这个项目开始,你应该专注于解决非常复杂的问题cific问题(例如:能够提取一个单词并将其放入周围所有单词给出的上下文中的简单解析系统)。数据分析/管理程序开发的复杂性为0-10级(包括算法的固有困难和考虑预期数据量的数据库优化),为此提供足够准确的解决方案可能很容易得到8.Hm。您所说的8是什么意思?对于此类开发(数据分析/管理)而言,复杂度为0-10,我想说你想要的东西可以被评为8。也就是说,如果你没有太多的经验,你不应该从一个如此困难的项目开始。我明白了。除非我开发一个算法,否则没有其他方法可以做到这一点?