Regex 解析文件的最佳方式(非特定语言)

Regex 解析文件的最佳方式(非特定语言),regex,parsing,Regex,Parsing,这并不是真正以一种语言为中心,但如果您想以该语言为例,可以这样做 我的问题是,我有一个大文件,我想解析它,寻找特定的头(以十六进制读取),比如说,我在寻找F133 AFFC 4000 5200 F1FC,最好的方法是查找它,而不是一次读取一个字节,检查它是否符合F1,然后检查下一个字节是否符合33,依此类推(基本上是嵌套的IF语句是我目前的工作方式)?我使用嵌套的IF语句,因为我不能一次读取X字节,因为这可能会减少我寻找的内容的一半,我会错过它 一旦你发现了这一点,你会怎么说读取4字节40字节在

这并不是真正以一种语言为中心,但如果您想以该语言为例,可以这样做

我的问题是,我有一个大文件,我想解析它,寻找特定的头(以十六进制读取),比如说,我在寻找F133 AFFC 4000 5200 F1FC,最好的方法是查找它,而不是一次读取一个字节,检查它是否符合F1,然后检查下一个字节是否符合33,依此类推(基本上是嵌套的IF语句是我目前的工作方式)?我使用嵌套的IF语句,因为我不能一次读取X字节,因为这可能会减少我寻找的内容的一半,我会错过它

一旦你发现了这一点,你会怎么说读取4字节40字节在标题后,然后说8字节120字节在标题后,如果这是有意义的


我只是想高效地编写代码,在谷歌搜索之后,我没有那么多明确的答案?答案是否和使用RegEx一样简单?

你需要超级高效,还是你的目标是可读代码?我想可读代码,因为文件不应该太大,我只是想学习最佳实践。输入文件是什么结构良好且不变(就结构而言?)是什么创建了该文件?仅供参考解析搜索否它似乎在移动,它是一个Microsoft数据库文件,属于某种专有格式(自然)。因此我不能从一开始就使用偏移量,我必须查找条目签名。