C++ 如何从HTML页面获取字符集

C++ 如何从HTML页面获取字符集,c++,html,linux,character-encoding,content-encoding,C++,Html,Linux,Character Encoding,Content Encoding,我试图在任何HTML元标记中获取charset属性。 (即) 在Linux下有没有办法在C++中实现这一点。我使用HTML tidy作为解析器,但我无法获取该属性以返回与us ascii不同的任何内容(即使编码为utf-8)这是我得到的输出: **4节点:元 名称属性:http等价 值属性:内容类型 名称属性:内容 值属性:text/html;字符集=美国ascii码 根据Vinko Vrsalovic的要求,以下是获得该结果的代码: void dumpNode(TidyNode tnod,in

我试图在任何HTML元标记中获取charset属性。 (即
) 在Linux下有没有办法在C++中实现这一点。我使用HTML tidy作为解析器,但我无法获取该属性以返回与us ascii不同的任何内容(即使编码为utf-8)
这是我得到的输出: **4节点:元
名称属性:http等价
值属性:内容类型
名称属性:内容
值属性:text/html;字符集=美国ascii码


根据Vinko Vrsalovic的要求,以下是获得该结果的代码:
void dumpNode(TidyNode tnod,int indent)
{
TidyNode子节点;

对于(child=tidyGetChild(tnod);child;child=tidyGetNext(child))
{
ctmbstr名称;
开关(TidyNodeType(子项))
{
case TidyNode_Root:name=“Root”break;
案例TidyNode\u DocType:name=“DocType”break;
case TidyNode_Comment:name=“Comment”break;
case TidyNode_ProcIns:name=“Processing Instruction”break;
case TidyNode_Text:name=“Text”break;
案例TidyNode\u CDATA:name=“CDATA”break;
case TidyNode_Section:name=“XML Section”break;
case TidyNode_Asp:name=“Asp”break;
case TidyNode_Jste:name=“Jste”break;
case TidyNode_Php:name=“Php”break;
case TidyNode_XmlDecl:name=“XML声明”break;

案例TidyNode_开始:
案例TidyNode_End:
案例TidyNode_StartEnd:
默认值:
name=tidyNodeGetName(子项);
TidyAttr att=tidyAttrFirst(儿童);
while(att)
{

std::cout<您能粘贴代码吗?HTML Tidy可以检查内容类型标题,确保在传递节点之前,您不认为框架正在转换为美国ascii码?