C++ 如何在C+中读取WCP-1252字符+;?

C++ 如何在C+中读取WCP-1252字符+;?,c++,file-io,ansi,ifstream,windows-1252,C++,File Io,Ansi,Ifstream,Windows 1252,我在谷歌上搜索了一下,但找不到一个明确的答案(可能没有使用正确的术语?) 无论如何,我有一些ANSI格式的文本文件(WCP-1252),我想在C++程序中处理这些字符,但是问题是我不知道如何存储对应于十进制代码128到255的2字节字符。不过,为了确定,我尝试了以下代码: ifstream infile("textfile.txt"); char c; infile>>c; //also tried infile.get(c);

我在谷歌上搜索了一下,但找不到一个明确的答案(可能没有使用正确的术语?)

无论如何,我有一些ANSI格式的文本文件(WCP-1252),我想在C++程序中处理这些字符,但是问题是我不知道如何存储对应于十进制代码128到255的2字节字符。不过,为了确定,我尝试了以下代码:

ifstream infile("textfile.txt");
char c;
infile>>c;                           //also tried infile.get(c);  
cout<<c;
ifstream-infle(“textfile.txt”);
字符c;
填充>>c//还尝试了infle.get(c);

coutWCP-1252以8位表示,但某些字符不是ASCII的一部分。我建议您编写一个从WCP-1252到wchar\t的转换表。逐字符读取字符并转换为wchar\t。 你可以写一张地图。例如:

wchar_t WCP1252Towc( char ch )
{
    static map< char, wchar_t > table
    {

        {0x30, L'0' },
        {0x31, L'1' },
        // ..
        {0x39, L'9'},

        {0x40, L'A'},
        // ...
        {0x5A, L'Z'},

        {0x61, L'a'},
        // ...
        {0x7A, L'z'},

        // ...
    };

    return table[ ch ]; 
};  

wstring WCP1252sTowcs( string str )
{
    const auto len = str.size();
    wstring res( len, L'\0' );

    for( size_t i = 0; i < len; ++i )
        res[ i ] = WCP1252Towc( str[ i ] );

    return res;
}

ifstream infile("textfile.txt");
string line; getline( infile, line );
auto unicode = WCP1252sTowcs( line );
wcout << unicode;
wchar\u t WCP1252Towc(char-ch)
{
静态映射表
{
{0x30,L'0'},
{0x31,L'1'},
// ..
{0x39,L'9'},
{0x40,L'A'},
// ...
{0x5A,L'Z'},
{0x61,L'a'},
// ...
{0x7A,L'z'},
// ...
};
返回表[ch];
};  
wstring WCP1252sTowcs(字符串str)
{
const auto len=str.size();
wstring res(len,L'\0');
对于(尺寸i=0;iwcout读取字符实际上不是问题所在,但您正在将它们转换为其他内容(而“2字节”表示为Unicode)。您是正确的:您不能将Unicode字符存储到简单字符中。改用
wchar
。然而,
cout
在高ASCII字符上失败是另一个(不相关的)问题;会捕获不可打印的内容,但打印出来是另一回事。试试
coutar您确定文件中有两个字节字符吗?除非我感到困惑,否则WCP-1252只包含0-255或单字节的字符。请稍候编辑问题。“第一个字节的值和第二个字节的值”——不可能。Win-1252指定ASCII代码页,所有值仅为1个字符宽。。。将这个神秘文本的一小部分粘贴到你的帖子中。我打赌是UTF8。谢谢。我现在正在制作一个完整的映射,但是角色前面的映射条目中的“L”是怎么回事?因为有些字符WCP1252不能用字符类型表示。您需要使用wchar\u t,因此在字符串告诉编译器我们使用的是wchar\u t而不是char之前,
wchar\u t
是特定于实现的,不能保证能够存储unicode字符。因此,我根据您的代码编写了一个简短的代码:我正在使用它读取一个只存储了符号的文本文件(因此地图中只有一个条目),但就像我在问题中的第一个代码一样,它只是在控制台中打印一个8。我是做错了什么,还是我的Visual Studio没有使用WCP-1252或其他东西?(我假设默认情况下会这样做).我发现了一些有趣的事情:控制台应用程序很难打印非ASCII字符:看起来: