Machine learning 聚集起点/终点

Machine learning 聚集起点/终点,machine-learning,classification,cluster-analysis,o-d-matrix,Machine Learning,Classification,Cluster Analysis,O D Matrix,我有1000个地理点(纬度、长度)作为起点/终点。还有一个历史数据显示了一些O-D对之间的旅行成本。对于一些O-D,数据集中没有记录,而一些O-D有多个记录,成本不同(例如,由于季节性) 我想将这1000个点分为几个簇(例如20个),不仅基于它们的位置(纬度、经度),还考虑平均旅行成本和共享目的地点 如果您对这些数据的聚类有任何建议,请告诉我,我将不胜感激 您必须以某种方式处理缺少的值-为它们指定一些给定的标签或取一些平均值/中值。然后,您可以使用任何您想要的算法(不同类型的特征可以一起用作算法

我有1000个地理点(纬度、长度)作为起点/终点。还有一个历史数据显示了一些O-D对之间的旅行成本。对于一些O-D,数据集中没有记录,而一些O-D有多个记录,成本不同(例如,由于季节性)

我想将这1000个点分为几个簇(例如20个),不仅基于它们的位置(纬度、经度),还考虑平均旅行成本和共享目的地点


如果您对这些数据的聚类有任何建议,请告诉我,我将不胜感激

您必须以某种方式处理缺少的值-为它们指定一些给定的标签或取一些平均值/中值。然后,您可以使用任何您想要的算法(不同类型的特征可以一起用作算法的输入)

若数据的维度不太多,并且您或多或少知道可能有多少个集群,那个么k-means算法应该可以很好地工作


如果你想在2d和3d上可视化你的数据和簇,并且你有更多的特征,你必须应用降维(PCA,t-SNE)

这是不明确的。将它们放入随机分区。(或正式确定质量目标)