Database design 群组来源游戏社区的社区标准?

Database design 群组来源游戏社区的社区标准?,database-design,artificial-intelligence,crowdsourcing,Database Design,Artificial Intelligence,Crowdsourcing,我托管了一些源游戏服务器,并运行了一个插件,将玩家聊天转储到MySQL数据库。我有一点安静的聊天历史,并正在寻找一些有趣的事情做它。我想建立一个系统,允许我的社区成员决定什么是“可接受的”,什么是“不可接受的” 我的想法是这样的: 不知何故,我允许我的社区成员查看聊天日志(不确定谁说了什么),并将日志标记为“可接受”或“不可接受”。我必须弄清楚它是否只会显示一段时间内的文本,或者只显示特定时间内的特定用户,或者只显示单独的行(可能很好……也可能意味着用户完全错过了聊天的上下文) 这有点像capt

我托管了一些源游戏服务器,并运行了一个插件,将玩家聊天转储到MySQL数据库。我有一点安静的聊天历史,并正在寻找一些有趣的事情做它。我想建立一个系统,允许我的社区成员决定什么是“可接受的”,什么是“不可接受的”

我的想法是这样的: 不知何故,我允许我的社区成员查看聊天日志(不确定谁说了什么),并将日志标记为“可接受”或“不可接受”。我必须弄清楚它是否只会显示一段时间内的文本,或者只显示特定时间内的特定用户,或者只显示单独的行(可能很好……也可能意味着用户完全错过了聊天的上下文)

这有点像captcha系统,多个用户最终会对同一系列聊天日志进行分级。从那里,我可以得到一组单词的值。理论上,它会创造一个门槛,在这个门槛上,某些事情是可以接受的,而另一些事情是不可以接受的。在对我现有的日志进行一定数量的分级后,我将有一种有意义的方法来确定消息是否符合我的社区定义的标准

我的问题是:

  • 您建议我向正在分级日志的用户展示什么?我应该给他们看一组X聊天台词吗?我是否应该每隔5分钟显示所有聊天线路?我是否应该缩小这两个窗口,在X行的时间范围内只显示一个用户的消息?或者用户应该单独为每一行评分?我计划限制特定社区成员每天可以评分的行数/组数
  • 设计存储所有这些数据的数据库的合适方法是什么?目前,每个单独的聊天行都作为自己的行存储在MySQL中。每个人都有一个唯一的ID以及游戏中发送的聊天信息的全文。我也得到了球员的名字和服务器,但我不认为这是必要的 我想创造这样的方式,使之成为自给自足/适应社区和他们认为可以接受的。随着时间的推移,将有更多的行被分级并添加到阈值/计算中,以确定消息是否为“好的”/“坏的”。如果有人建造过类似的东西,你能指出我在建造时应该避免的陷阱吗

  • 如果可能的话,我宁可考虑用户能够实时标记消息不合适。普通用户可以这样做,而不是你不得不找人离线查看。如果您不能或不想使用这种方法:在任何其他消息的上下文之外,消息可能会被识别为不合适的,但是查看连续的消息流,按照它们在实时中出现的顺序,可能会有所帮助。我可能会给他们X个连续的信息。对于实时标记,我建议在之前和之后发送一些消息,标记的消息显示为红色,或者类似的东西

    当用户查看一定数量的消息时,您可以尝试建立某种奖励系统。如果允许实时标记消息,则可以奖励查看标记消息以确认标记状态的人员

    知道它是哪个玩家可能会有用。如果一个玩家发布了一些不合适的信息,你可以发布警告或禁令或其他东西。服务器可能并没有那个么有用,但我完全支持存储一些额外的信息,你们以后可能会发现它们的用处

    我不会真的挂断数据库存储。根据您希望执行的操作类型,拥有一个包含时间列(或自动递增ID列,或两者兼有)、播放器、服务器、消息、ISInapropriate列的表应该是合适的

    你可以采取的一种方法(一旦你有一些邮件被标记为不合适的)将非常类似于垃圾邮件过滤器(你应该能够找到足够的材料)

    一般的考虑是,当标记为不适当时,您是希望宽大还是严格(您是希望遗漏一些不适当的消息,还是希望标记一些可以忽略的消息)。查看精确性/召回率,以了解这一点


    我怀疑,在聊天环境中,它可能在大多数情况下只需查找(并且可能尝试自动识别)出现在不适当消息中的特定单词。

    < P>我宁愿认为用户能够在实时的情况下标记消息是不合适的。普通用户可以这样做,而不是你不得不找人离线查看。如果您不能或不想使用这种方法:在任何其他消息的上下文之外,消息可能会被识别为不合适的,但是查看连续的消息流,按照它们在实时中出现的顺序,可能会有所帮助。我可能会给他们X个连续的信息。对于实时标记,我建议在之前和之后发送一些消息,标记的消息显示为红色,或者类似的东西

    当用户查看一定数量的消息时,您可以尝试建立某种奖励系统。如果允许实时标记消息,则可以奖励查看标记消息以确认标记状态的人员

    知道它是哪个玩家可能会有用。如果一个玩家发布了一些不合适的信息,你可以发布警告或禁令或其他东西。服务器可能并没有那个么有用,但我完全支持存储一些额外的信息,你们以后可能会发现它们的用处

    我不会真的挂断数据库存储。根据您希望执行的操作类型,拥有一个包含时间列(或自动递增ID列,或两者兼有)、播放器、服务器、消息、ISInapropriate列的表应该是合适的

    您可以采取的方法(一旦您有一些邮件被标记为不合适)与垃圾邮件过滤器非常相似(您应该这样做)