Java 基于机器学习的JSON文档聚类
我正在尝试执行文档聚类。输入格式是一个JSON字符串,具有各种字符串和数字类型的键和值。根据存在的键的类型和值,我应该能够使用自己的类似类型对文档进行集群 例如:JSOn文档:Java 基于机器学习的JSON文档聚类,java,json,machine-learning,cluster-analysis,data-science,Java,Json,Machine Learning,Cluster Analysis,Data Science,我正在尝试执行文档聚类。输入格式是一个JSON字符串,具有各种字符串和数字类型的键和值。根据存在的键的类型和值,我应该能够使用自己的类似类型对文档进行集群 例如:JSOn文档: {“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”}, {“标题”:0,“品牌”:“李维斯”,“长度”:“28,30,32,34,36”,“类型”:“衬衫”}, {“title”:0,“brand”:“Levis”,“length”:“2
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”},
{“标题”:0,“品牌”:“李维斯”,“长度”:“28,30,32,34,36”,“类型”:“衬衫”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Top”},
{“title”:0,“Bname”:“Brand1”,“weight”:“100”,“type”:“Top”},
{“title”:0,“Bname”:“Lee”,“height”:“2864”,“type”:“冰箱”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Top”},
{“标题”:0,“时间”:“卡西欧”,“价格”:“2000”,“类型”:“手表”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Top”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Shirt”}
基于匹配参数,我想对文档进行聚类
我想知道执行此操作的方法和可能的java机器学习库
到目前为止,我已经了解了聚类中的Kmeans和DBSCAN,但我不确定如何将JSON字符串简化为向量,以及如何对这些结果执行聚类。我会尝试将每个JSON字段转换为CSV上的一列或一些数据帧(如python熊猫),注意空值或格式不好的值 如果您正在使用Java,下面是该编程语言的机器学习示例。你可以应用同样的原则 是一个很好的java工具,可以开始尝试有监督和无监督的算法 祝你好运