C++ 使用libxml2解析XML文件的最快方法?
嗨,有没有更快的方法用libxml2解析XML文件? 现在我按照C++代码那样做:C++ 使用libxml2解析XML文件的最快方法?,c++,parsing,libxml2,C++,Parsing,Libxml2,嗨,有没有更快的方法用libxml2解析XML文件? 现在我按照C++代码那样做: void parse_element_names(xmlNode * a_node, int *calls) { xmlNode *cur_node = NULL; for (cur_node = a_node; cur_node; cur_node = cur_node->next) { (*calls)++; if(xmlStrEqual(xmlCharStrd
void parse_element_names(xmlNode * a_node, int *calls)
{
xmlNode *cur_node = NULL;
for (cur_node = a_node; cur_node; cur_node = cur_node->next) {
(*calls)++;
if(xmlStrEqual(xmlCharStrdup("to"),cur_node->name)){
//printf("node type: <%d>, name <%s>, content: <%s> \n", cur_node->children->type, cur_node->children->name, cur_node->children->content);
//do something with the content
parse_element_names(cur_node->children->children,calls);
}
else if(xmlStrEqual(xmlCharStrdup("from"),cur_node->name)) {
//printf("node type: <%d>, name <%s>, content: <%s> \n", cur_node->children->type, cur_node->children->name, cur_node->children->content);
//do something with the content
parse_element_names(cur_node->children->children,calls);
}
else if(xmlStrEqual(xmlCharStrdup("note"),cur_node->name)) {
//printf("node type: <%d>, name <%s>, content: <%s> \n", cur_node->children->type, cur_node->children->name, cur_node->children->content);
//do something with the content
parse_element_names(cur_node->children->children,calls);
}
.
.
.
//about 100 more node names comming
else{
parse_element_names(cur_node->children,calls);
}
}
}
int main(int argc, char **argv)
{
xmlDoc *doc = NULL;
xmlNode *root_element = NULL;
if (argc != 2)
return(1);
/*parse the file and get the DOM */
doc = xmlReadFile(argv[1], NULL, XML_PARSE_NOBLANKS);
if (doc == NULL) {
printf("error: could not parse file %s\n", argv[1]);
}
int calls = 0;
/*Get the root element node */
root_element = xmlDocGetRootElement(doc);
parse_element_names(root_element,&calls);
/*free the document */
xmlFreeDoc(doc);
xmlCleanupParser();
return 0;
}
void parse_元素_名称(xmlNode*a_节点,int*调用)
{
xmlNode*cur_node=NULL;
对于(cur_节点=a_节点;cur_节点;cur_节点=cur_节点->下一步){
(*呼叫)+;
if(xmlStrEqual(xmlCharStrdup(“to”),cur_node->name)){
//printf(“节点类型:,名称,内容:\n”,当前节点->子节点->类型,当前节点->子节点->名称,当前节点->子节点->内容);
//对内容做点什么
解析元素名称(当前节点->子节点->子节点,调用);
}
else if(xmlStrEqual(xmlCharStrdup(“from”),cur_node->name)){
//printf(“节点类型:,名称,内容:\n”,当前节点->子节点->类型,当前节点->子节点->名称,当前节点->子节点->内容);
//对内容做点什么
解析元素名称(当前节点->子节点->子节点,调用);
}
else if(xmlStrEqual(xmlCharStrdup(“注意”),cur_node->name)){
//printf(“节点类型:,名称,内容:\n”,当前节点->子节点->类型,当前节点->子节点->名称,当前节点->子节点->内容);
//对内容做点什么
解析元素名称(当前节点->子节点->子节点,调用);
}
.
.
.
//还有大约100个节点名正在提交
否则{
解析元素名称(当前节点->子节点,调用);
}
}
}
int main(int argc,字符**argv)
{
xmlDoc*doc=NULL;
xmlNode*根元素=NULL;
如果(argc!=2)
申报表(1);
/*解析文件并获取DOM*/
doc=xmlReadFile(argv[1],NULL,XML\u PARSE\u NOBLANKS);
如果(doc==NULL){
printf(“错误:无法分析文件%s\n”,argv[1]);
}
int=0;
/*获取根元素节点*/
根元素=xmlDocGetRootElement(doc);
解析元素名称(根元素和调用);
/*释放文档*/
xmlFreeDoc(doc);
xmlcleanuparser();
返回0;
}
这真的是最快的方式吗?或者有什么更好/更快的解决方案可以向我提供建议
谢谢
xmlReadFile
等都是基于libxml2的(事实上是),所以如果不需要生成的xmlDoc
,使用自己的SAX解析器通常会更快
如果必须区分许多不同的元素名称(如示例中所示),最快的方法通常是为每种类型的节点创建单独的函数,并使用哈希表查找这些函数。如果节点名称较多,则使用哈希表应该更快。请注意,使用
xmlCharStrdup
的方式会泄漏内存。只需将字符串文本强制转换为constxmlchar*
。对我来说,两次取消对孩子的引用也是错误的。