Informatica工作流XML中不需要的字符
我正在致力于自动检查Informatica工作流中SQL查询的最佳实践 我曾想过使用工作流XML来获取工作流中的所有SQL查询,但当我在UNIX中对.XML文件执行Informatica工作流XML中不需要的字符,xml,unix,character-encoding,Xml,Unix,Character Encoding,我正在致力于自动检查Informatica工作流中SQL查询的最佳实践 我曾想过使用工作流XML来获取工作流中的所有SQL查询,但当我在UNIX中对.XML文件执行grep或vi时,一些字符会转换为不需要的字符。 例如: ' - &apos > - > < - < ”——&apos >->
grep
或vi
时,一些字符会转换为不需要的字符。
例如:
' - &apos
> - >
< - <
”——&apos
>->
<-<
我想这可能是一个字符编码问题。XML文件的编码为ISO-8859-1。我尝试将编码转换为UTF-8和UTF-16,但仍然面临同样的问题
如果有人能帮我解决这个问题就太好了
另外,是否有其他方法可以在工作流中获取SQL,这可以满足我的目的。这些被称为“html实体”(每个实体后面实际上都有一个分号)。它与XML或UTF-8无关;工作流中的其他内容引入了它们。这不是编码问题。这就是XML如何转义特殊字符。想象一下,如果您想使用
“
,那么您可以使用”
。如果您使用的应用程序可以解析XML,那么它将正确处理这些问题。但是,我认为您将与grep
斗争。我建议寻找XML解析库。Robert非常适合。。。考虑到XML是一种基于标签的语言,标签是用<和>字符定义的,所以如果这些字符没有转换成它们的转义形式,那么生成的文件就不能很好地形成,因此不能由XML解析器读取。您可以提取那些包含sql的字段。。。