Excel 除了使用文件扩展名…有没有办法自动检测文件类型
我必须为搜索工具编写代码,其中第一阶段是区分文件是excel还是PDF,然后执行相应的代码部分并从文件中读取数据。然后将数据用作搜索结果。对于excel部分,我不得不使用SSIS包读取数据,并将其安排在不同的电子表格中,以获得结果…而对于PDF。我还在努力。但是在做任何事情之前,我的代码都必须识别文件类型。对于许多类型的文件,文件的前几个字节是一个“”来识别文件类型 例如,PDF文件以Excel 除了使用文件扩展名…有没有办法自动检测文件类型,excel,pdf,Excel,Pdf,我必须为搜索工具编写代码,其中第一阶段是区分文件是excel还是PDF,然后执行相应的代码部分并从文件中读取数据。然后将数据用作搜索结果。对于excel部分,我不得不使用SSIS包读取数据,并将其安排在不同的电子表格中,以获得结果…而对于PDF。我还在努力。但是在做任何事情之前,我的代码都必须识别文件类型。对于许多类型的文件,文件的前几个字节是一个“”来识别文件类型 例如,PDF文件以%PDF或0x25 0x50 0x44 0x46开头 Excel工作簿的神奇数字是文件中的512字节 有一些库(
%PDF
或0x25 0x50 0x44 0x46开头
Excel工作簿的神奇数字是文件中的512字节
有一些库(libmagic
)和命令行工具(file
,mimetype
)可以为您查找文件类型,而无需了解所有文件类型的复杂细节