Python 使用BERT(无监督学习)对无标签的异构日志进行聚类

Python 使用BERT(无监督学习)对无标签的异构日志进行聚类,python,tensorflow2.0,bert-language-model,anomaly-detection,Python,Tensorflow2.0,Bert Language Model,Anomaly Detection,我有一个日志文件,在一个文件中包含不同的服务日志,如apache、Hadoop、spark、ssh、HDFS、HPC和许多其他类型的日志。我使用BERT FullTokenizer标记日志。我也看到了这个问题,但并没有得到直觉。我想对上述日志进行聚类,并使用BERT模型以图形化的方式对它们进行可视化。任何关于此任务的建议或任何有用的文档都将不胜感激

我有一个日志文件,在一个文件中包含不同的服务日志,如apache、Hadoop、spark、ssh、HDFS、HPC和许多其他类型的日志。我使用BERT FullTokenizer标记日志。我也看到了这个问题,但并没有得到直觉。我想对上述日志进行聚类,并使用BERT模型以图形化的方式对它们进行可视化。任何关于此任务的建议或任何有用的文档都将不胜感激