C++ 如何从HTML页面获取字符集_C++_Html_Linux_Character Encoding_Content Encoding

C++ 如何从HTML页面获取字符集

c++ html linux character-encoding

C++ 如何从HTML页面获取字符集,c++,html,linux,character-encoding,content-encoding,C++,Html,Linux,Character Encoding,Content Encoding,我试图在任何HTML元标记中获取charset属性。（即）在Linux下有没有办法在C++中实现这一点。我使用HTML tidy作为解析器，但我无法获取该属性以返回与us ascii不同的任何内容（即使编码为utf-8）这是我得到的输出： **4节点：元名称属性：http等价值属性：内容类型名称属性：内容值属性：text/html；字符集=美国ascii码根据Vinko Vrsalovic的要求，以下是获得该结果的代码： void dumpNode（TidyNode tnod，in

我试图在任何HTML元标记中获取charset属性。（即

）在Linux下有没有办法在C++中实现这一点。我使用HTML tidy作为解析器，但我无法获取该属性以返回与us ascii不同的任何内容（即使编码为utf-8）
这是我得到的输出： **4节点：元
名称属性：http等价
值属性：内容类型
名称属性：内容
值属性：text/html；字符集=美国ascii码

根据Vinko Vrsalovic的要求，以下是获得该结果的代码：
void dumpNode（TidyNode tnod，int indent）
{
TidyNode子节点；

对于（child=tidyGetChild（tnod）；child；child=tidyGetNext（child））
{
ctmbstr名称；
开关（TidyNodeType（子项））
{
case TidyNode_Root:name=“Root”break；
案例TidyNode\u DocType:name=“DocType”break；
case TidyNode_Comment:name=“Comment”break；
case TidyNode_ProcIns:name=“Processing Instruction”break；
case TidyNode_Text:name=“Text”break；
案例TidyNode\u CDATA:name=“CDATA”break；
case TidyNode_Section:name=“XML Section”break；
case TidyNode_Asp:name=“Asp”break；
case TidyNode_Jste:name=“Jste”break；
case TidyNode_Php:name=“Php”break；
case TidyNode_XmlDecl:name=“XML声明”break；

案例TidyNode_开始：
案例TidyNode_End:
案例TidyNode_StartEnd:
默认值：
name=tidyNodeGetName（子项）；
TidyAttr att=tidyAttrFirst（儿童）；
while（att）
{

std：：cout<您能粘贴代码吗？HTML Tidy可以检查内容类型标题，确保在传递节点之前，您不认为框架正在转换为美国ascii码？