Python 恶意软件对完整文件访问路径的不同表示

Python 恶意软件对完整文件访问路径的不同表示,python,machine-learning,text-classification,malware,malware-detection,Python,Machine Learning,Text Classification,Malware,Malware Detection,我目前正在使用动态分析检测恶意软件。我有恶意软件和良性可执行文件访问的所有文件的列表。我的目标是根据分析报告中提取的信息构建分类器 到目前为止,我正在使用文件路径字符串c:\hvtqk\modules\packages\reboot.py作为分类器中的一个单独维度。我只是想知道是否还有其他的创新技术可以用来对路径字符串进行特征化?< p>可以使用路径小写的哈希,并且只考虑目录而不考虑文件名,因为许多恶意软件都写随机文件名,但是写到公共目录。那么你建议计算在最常用的目录中有多少文件被触摸?是的,你

我目前正在使用动态分析检测恶意软件。我有恶意软件和良性可执行文件访问的所有文件的列表。我的目标是根据分析报告中提取的信息构建分类器


到目前为止,我正在使用文件路径字符串c:\hvtqk\modules\packages\reboot.py作为分类器中的一个单独维度。我只是想知道是否还有其他的创新技术可以用来对路径字符串进行特征化?

< p>可以使用路径小写的哈希,并且只考虑目录而不考虑文件名,因为许多恶意软件都写随机文件名,但是写到公共目录。

那么你建议计算在最常用的目录中有多少文件被触摸?是的,你可以这样做。或者将目录路径视为字符串,并成为您从培训集中获得的功能之一。因此,分类器在测试集之后遇到时将考虑路径作为特征。