Jakarta ee j2ee环境下基于数据挖掘的健康预测系统

Jakarta ee j2ee环境下基于数据挖掘的健康预测系统,jakarta-ee,expert-system,Jakarta Ee,Expert System,我想开发一个使用数据挖掘的健康预测系统。有人能给我一些关于如何开发它的建议吗 要求是,当用户输入第一个症状时,系统将检查有多少疾病具有相同的症状,然后系统将提供一些与症状相关的选项,以便能够区分这些疾病并推断出疾病是什么 这里添加的组件(这就是数据挖掘和预测部分的作用所在)是,当用户输入症状时,它还应该提示他们可能正在经历的其他症状。例如,如果他们发烧,他们也很可能有寒战,因此当他们进入“发烧”状态时,应该建议将“寒战”作为额外症状 以下是一种可能的数据库设计: 下面是一个数据的示例: 因此,

我想开发一个使用数据挖掘的健康预测系统。有人能给我一些关于如何开发它的建议吗

要求是,当用户输入第一个症状时,系统将检查有多少疾病具有相同的症状,然后系统将提供一些与症状相关的选项,以便能够区分这些疾病并推断出疾病是什么

这里添加的组件(这就是数据挖掘和预测部分的作用所在)是,当用户输入症状时,它还应该提示他们可能正在经历的其他症状。例如,如果他们发烧,他们也很可能有寒战,因此当他们进入“发烧”状态时,应该建议将“寒战”作为额外症状


以下是一种可能的数据库设计:

下面是一个数据的示例: 因此,基本上,这是说流感的症状是发烧、发冷和疲劳,但感冒的症状只是“疲劳”。(显然,这还不完全,但这是很好的例证)

一个人搜索一种症状为“发烧”和“寒战”的疾病。第二个人搜索的是症状只是“寒战”的疾病。第三个人搜索的是一种症状为“发烧”和“疲劳”的疾病

搜索将通过存储过程完成:您输入一个或多个症状,它将搜索记录插入SearchHistory表,并检索与这些症状相关的疾病列表

如果要计算两个症状同时出现的几率,可以使用用户定义的函数计算包含这两个症状的搜索百分比。例如,如果搜索1、2和3都有“发烧”和“发冷”症状,但搜索4有“发烧”和“疲劳”,搜索5只有“发冷”,那么搜索“发烧”的人搜索“发冷”的几率显然是60%

搜索“发烧”的人也有20%的几率搜索“疲劳”,但在这种情况下,样本显然太小,无法确定这是否具有代表性。(这是这种设计的缺点之一——随着时间的推移,你的预测会变得更好,但早期的预测可能不太准确)

这样做的好处是,您不必手动输入任何关于任何症状同时发生的概率的数据,并且系统将随着时间的推移“自动”调整和改进(即,当您获得更多数据时,您的预测将不断改进),这取决于您的系统用户搜索的对象

当然,不利的一面是,一旦人们开始使用该系统,你就只能获得可能同时出现的症状的数据,因此早期用户无法获得预测的优势,而且需要一段时间才能准确预测哪些症状可能“同时出现”(想想上面的例子,你预测“发烧”和“疲劳”只在一次搜索中同时出现的几率为20%)


希望这能有所帮助。

我很困惑;你真正的问题是什么?你说的“一些提示”是什么意思你能更具体地说明你需要什么帮助吗?我不是说我需要整个代码,但我不知道如何开发它,我需要一些如何前进的想法。我应该从哪里开始。目前还不清楚你做了什么。你有设计吗?你收集了你的需求吗?你基本上是在试图设计一个专家的产品吗系统还是规则引擎?我想设计一个专家系统对不起,我不知道如何开发it@Hetaram你能更具体地说明你对什么感到困惑吗?这对我来说是一个全新的概念。我不知道如何实现它。你提供了一些数据,你已经创建了两个表,一个是症状表,另一个是疾病表,但我只有一个表,属性是id、name、symptoms和type。那么如何使用这个表来实现它呢concept@Hetaram你肯定想把症状和疾病分开,否则,你会得到大量的冗余数据。另外,每种疾病都可能有任意数量的症状。好的,我已经这样做了,但是现在如何获取用户输入一个症状以预测疾病后的症状