Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/json/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 基于机器学习的JSON文档聚类_Java_Json_Machine Learning_Cluster Analysis_Data Science - Fatal编程技术网

Java 基于机器学习的JSON文档聚类

Java 基于机器学习的JSON文档聚类,java,json,machine-learning,cluster-analysis,data-science,Java,Json,Machine Learning,Cluster Analysis,Data Science,我正在尝试执行文档聚类。输入格式是一个JSON字符串,具有各种字符串和数字类型的键和值。根据存在的键的类型和值,我应该能够使用自己的类似类型对文档进行集群 例如:JSOn文档: {“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”}, {“标题”:0,“品牌”:“李维斯”,“长度”:“28,30,32,34,36”,“类型”:“衬衫”}, {“title”:0,“brand”:“Levis”,“length”:“2

我正在尝试执行文档聚类。输入格式是一个JSON字符串,具有各种字符串和数字类型的键和值。根据存在的键的类型和值,我应该能够使用自己的类似类型对文档进行集群

例如:JSOn文档:

{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”},
{“标题”:0,“品牌”:“李维斯”,“长度”:“28,30,32,34,36”,“类型”:“衬衫”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Jeans”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Top”},
{“title”:0,“Bname”:“Brand1”,“weight”:“100”,“type”:“Top”},
{“title”:0,“Bname”:“Lee”,“height”:“2864”,“type”:“冰箱”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Top”},
{“标题”:0,“时间”:“卡西欧”,“价格”:“2000”,“类型”:“手表”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Top”},
{“title”:0,“brand”:“Levis”,“length”:“28,30,32,34,36”,“type”:“Shirt”}

基于匹配参数,我想对文档进行聚类

我想知道执行此操作的方法和可能的java机器学习库


到目前为止,我已经了解了聚类中的Kmeans和DBSCAN,但我不确定如何将JSON字符串简化为向量,以及如何对这些结果执行聚类。

我会尝试将每个JSON字段转换为CSV上的一列或一些数据帧(如python熊猫),注意空值或格式不好的值

如果您正在使用Java,下面是该编程语言的机器学习示例。你可以应用同样的原则

是一个很好的java工具,可以开始尝试有监督和无监督的算法

祝你好运