Informatica工作流XML中不需要的字符_Xml_Unix_Character Encoding

Informatica工作流XML中不需要的字符

xml unix character-encoding

Informatica工作流XML中不需要的字符,xml,unix,character-encoding,Xml,Unix,Character Encoding,我正在致力于自动检查Informatica工作流中SQL查询的最佳实践我曾想过使用工作流XML来获取工作流中的所有SQL查询，但当我在UNIX中对.XML文件执行grep或vi时，一些字符会转换为不需要的字符。例如： ' - &apos > - &gt < - &lt ”——&apos >->

我正在致力于自动检查Informatica工作流中SQL查询的最佳实践

我曾想过使用工作流XML来获取工作流中的所有SQL查询，但当我在UNIX中对.XML文件执行

grep

或

vi

时，一些字符会转换为不需要的字符。例如：

' - &apos
> - &gt
< - &lt

”——&apos
>->
<-<

我想这可能是一个字符编码问题。XML文件的编码为ISO-8859-1。我尝试将编码转换为UTF-8和UTF-16，但仍然面临同样的问题

如果有人能帮我解决这个问题就太好了

另外，是否有其他方法可以在工作流中获取SQL，这可以满足我的目的。

这些被称为“html实体”（每个实体后面实际上都有一个分号）。它与XML或UTF-8无关；工作流中的其他内容引入了它们。这不是编码问题。这就是XML如何转义特殊字符。想象一下，如果您想使用

“

，那么您可以使用

”

。如果您使用的应用程序可以解析XML，那么它将正确处理这些问题。但是，我认为您将与

grep

斗争。我建议寻找XML解析库。Robert非常适合。。。考虑到XML是一种基于标签的语言，标签是用<和>字符定义的，所以如果这些字符没有转换成它们的转义形式，那么生成的文件就不能很好地形成，因此不能由XML解析器读取。您可以提取那些包含sql的字段。。。