C++ setw（）在包含UTF-8多字节字符/代码点的字符串上嵌入错误的输出_C++_Utf 8_Locale_Cout_Setw - Fatal编程技术网

C++ setw（）在包含UTF-8多字节字符/代码点的字符串上嵌入错误的输出

c++ utf-8

C++ setw（）在包含UTF-8多字节字符/代码点的字符串上嵌入错误的输出,c++,utf-8,locale,cout,setw,C++,Utf 8,Locale,Cout,Setw,我需要输出一些可能是UTF-8多字节的数据，并且需要使用setw（）对它们进行格式化当字符为多字节序列时，验证将丢失并且setw（）无法正常工作 //#include <stdio.h> #include <locale> #include <iostream> //#include <fstream> #include <iomanip> //#include <sstream> int main(int argc,

我需要输出一些可能是UTF-8多字节的数据，并且需要使用

setw（）

对它们进行格式化

当字符为多字节序列时，验证将丢失并且

setw（）

无法正常工作

//#include <stdio.h>
#include <locale>
#include <iostream>
//#include <fstream>
#include <iomanip>
//#include <sstream>

int main(int argc, char **argv)
{ 
    std::locale l=std::locale("en_US.utf8");
    std::locale::global(l); 
    std::cout.imbue(l);
    std::cout<<std::endl;
    std::cout<<std::setw(40)<<std::right<<"hi “my” friend"<<std::endl;
    std::cout<<std::setw(40)<<std::right<<"hi -my- friend"<<std::endl;
    return 0;
}

我错过了什么

我必须指出，字符

“

和

”

不是普通的

“

，而是另外两个字符，它们在UTF-8中分别用三个字节表示。

字符串文字

“hi-my-friend”

包含14个字符。字符串文字

“hi”my“friend”“

包含18个字符：

cout

按原样输出这些字符，目标终端将3字节序列转换为单个符号

因此，从流的角度来看，一切都正常：它输出

（宽度-strlen（literal））

填充字符，然后

strlen（literal）

字符，

宽度

总计。它不处理可能的多字节序列，也不知道目标终端将几个字符转换为一个符号

String literal

“hi-my-friend”

包含14个字符。字符串文字

“嗨”我的“朋友”

包含18个字符：

cout

按原样输出这些字符，目标终端将3字节序列转换为单个符号

因此，从流的角度来看，一切都正常：它输出

（宽度-strlen（literal））

填充字符，然后

strlen（literal）

字符，

宽度

总计。它不处理可能的多字节序列，也不知道目标终端将几个字符转换为一个符号

您可以通过计算字符串在宽表示形式下的字符数来完成此格式化，然后计算字符串长度与宽表示形式之间的差异，然后将此差异添加到传递给

setw

的内容中，例如：

std::mbstate_t state = std::mbstate_t();
std::string s = "hi “my” friend";
const char *cp = s.c_str();
size_t len = mbsrtowcs(nullptr, &cp, s.size(), &state);
std::cout << setw(40 + (s.size() - len)) << std::right << s << std::endl;

std:：mbstate\u t state=std:：mbstate\u t（）；
std:：string s=“嗨”我的“朋友”；
const char*cp=s.c_str（）；
size_t len=mbsrtowcs（nullptr，&cp，s.size（），&state）；
std:：cout您可以通过计算字符串在宽表示形式下的字符数来完成此格式化，然后计算字符串长度与宽表示形式之间的差异，然后将该差异添加到传递给setw
的内容中，例如：
std::mbstate_t state = std::mbstate_t();
std::string s = "hi “my” friend";
const char *cp = s.c_str();
size_t len = mbsrtowcs(nullptr, &cp, s.size(), &state);
std::cout << setw(40 + (s.size() - len)) << std::right << s << std::endl;

std:：mbstate\u t state=std:：mbstate\u t（）；
std:：string s=“嗨”我的“朋友”；
const char*cp=s.c_str（）；
size_t len=mbsrtowcs（nullptr，&cp，s.size（），&state）；
std：：cout可以预期具有区域设置知识的流将处理必要的转换。如果不是，则“setw”无效，因为它不执行用户期望的操作。“灌输”是什么意思？显然，不仅需要终端，还需要文件，因为这些文件可能包含utf8文本（或选择的任何编码）。@GeorgeKourtis如果你查看locale
类，你会发现它实际上没有处理多字节编码的功能。整个本地化库和所有标准流都需要固定宽度的编码。它提供的唯一功能是wstring\u convert
和codevt.*
在编码之间进行转换的类。在将数据传递到标准库设施之前，您需要将数据转换为固定宽度编码。简而言之：您正在向它提供它无法处理的数据。要么将数据转换为固定宽度，要么不依赖于除原始字符输出以外的任何额外内容。具有区域设置知识的流将处理必要的转换。如果不是，则“setw”无效，因为它不执行用户期望的操作。“灌输”是什么意思？显然，不仅需要终端，还需要文件，因为这些文件可能包含utf8文本（或选择的任何编码）。@GeorgeKourtis如果你查看locale
类，你会发现它实际上不需要处理多字节编码。整个本地化库和所有标准流都需要固定宽度的编码。它提供的唯一功能是wstring\u convert
和codevt.*
在编码之间进行转换的类。在将数据传递到标准库设施之前，您需要将数据转换为固定宽度编码。简而言之：您正在向它提供它无法处理的数据。要么将数据转换为固定宽度，要么不依赖除原始字符输出以外的任何额外内容。遗憾的是，嵌入UTF-8语言环境不会使格式化函数了解UTF-8。完成任务的最简单方法是将所有内容转换为wchar\t并使用宽字符流。遗憾的是，嵌入UTF-8语言环境不会使格式化函数了解UTF-8。完成任务的最简单方法是将所有内容转换为wchar\u t并使用宽字符流。“宽”字符不需要是UTF-16、UTF-32或任何Unicode编码。因此，无法保证该代码将产生预期的结果。即使是这样，如果“宽”字符是UTF-16，它也只能为适合单个UTF-16代码单元的代码点生成有用的结果。这将生成19个，其中仅需要4个字符来纠正对齐。这似乎是由len作为最大ulong64_t值触发的，该值在或溢出下触发，以及所有有趣的东西。看起来必须显式定义区域设置才能工作“宽”字符不需要是UTF-16、UTF-32或任何Unicode编码。因此，无法保证该代码将产生预期的结果。即使是这样，如果“宽”字符是UTF-16，它也只能为适合单个UTF-16代码单元的代码点生成有用的结果。这将生成19个，其中仅需要4个字符来纠正对齐。这似乎是由
size_t f(const std::string &s)
{
  std::mbstate_t state = std::mbstate_t();
  const char *cp = s.c_str();
  size_t len = mbsrtowcs(nullptr, &cp, s.size(), &state);
  return s.size() - len;
}
...

std::string s = "hi “my” friend";
std::cout << std::setw(40 + f(s)) << std::right << s << std::endl;




[utf 8]相关文章推荐



                                                        
Utf 8 GLIBs UTF16BE和UTF-16BE的区别以及如何支持UTF16BE
utf-8 
WINE在CUI应用程序中读取文件时错误处理UTF-8
utf-8 
将SQL Server 2008 R2的编码（排序规则？）更改为UTF-8
utf-8sql-server-2008-r2 
Utf 8 如何在lua中将UTF8字节数组转换为字符串
utf-8lua 
Utf 8 Applescript:使用utf8类读取文本文件会触发错误
utf-8applescript 
如果在IIS 7.5中启用了SSI，则响应头中不会设置内容类型UTF-8
utf-8 
Utf 8 希伯来语支持
utf-8intellij-idea 
在Qt中创建名称包含UTF-8字符的目录
utf-8qt4 
Utf 8 Thorn符号（“xFE”）不适用于pig脚本
utf-8apache-pig 
Utf 8 如何在odoo 10上使用重音符号
utf-8openerp 
Utf 8 Camel中的java.io包找不到标题中带有特殊字符的文件
utf-8java-8apache-camel 
                                       





随机文章推荐



                                                        
Pandas 更改中的整数数据系列时出现类型错误
pandas 
Pandas 具有多个注释字符的Read_表
pandas 
使用pandas基于Cover_类型统计数据
pandas 
Pandas 如何在Panda数据帧中删除带零的行？
pandasdataframe 
Pandas 计算选定行之间的差异（）
pandas 
一次在Pandas面板中的项目之间添加列？
pandasdataframe 
Pandas 如何使用to_sql保存数据框列
pandassqlite 
Pandas 当两个数据帧合并到一个公共列上时，不复制公共行
pandasdataframe 
Pandas 如何使用数据帧中的其他列聚合数据帧中的列
pandaspython-2.7 
Pandas 如何按列分组并删除或分离熊猫中的值？
pandas 
Pandas 通过删除一列，从现有dataframe创建包含如此多列的新数据框
pandasdataframe 
Pandas 如何使用datetime操作对某些值求和
pandas 
Pandas 如何在熊猫数据帧上使用sagemaker进行预测
pandaslambda 
Pandas 基于连续的相同行进行聚合
pandas 
Pandas Panda系列删除具有特定年份的行
pandas 
Pandas 从列表到pd数据帧，再将问题重塑为神经网络的目标
pandasdataframeneural-network 
Pandas 熊猫，匹配图案并替换
pandas 
Pandas 如何将数据帧的行与组配对？
pandasdataframe 
Pandas str.contains不'；找不到部分匹配
pandasstring 
Pandas df.corr（）函数是否适用于时间序列列？
pandas


                                        

                                        
                                        


                                                
                                                        [c++]相关推荐
                                                        
如何复制C++；C中的类风格get函数？
我想在C++程序中从C++中复制一个get样式函数。在C++中，一个类中可以有两个函数用于赋值和设置值。在'C'中有没有等效的方式？假设我有以下结构：
typedef struct test_help
{
    int      a;
    void** numArrays;
    struct test_help *next;  
} help_node, *help;

int access_int(help damaru) {

									C++
							 									C
							 
从c+中的文件加载到二维数组+；
在C++中，从文件中读取数字到2D数组是有困难的。它可以很好地读取第一行，但其余的行都填充了0。我不知道我做错了什么
#include <iostream>
#include <fstream>

using namespace std;

int main()
{
    int myarray[20][20];

    int totRow = 20, totCol = 20, number, product, top
									C++
							 
C++ Submoleclang OSX山狮C++；11
									C++
							 									Sublimetext2
							 									Clang
							 
C++ 错误应为''；
									C++
							 
C++ OpenCV-识别视频帧上的规则模式
									C++
							 									Opencv
							 									Image Processing
							 
C++；处理及&；？（短路评估）
< P>遇到（BoOL＆& BOOL2）时，如果BoL1被发现是错误的，C++是否曾经试图检查布尔2，或者它是否以PHP的方式忽略它？
对不起，如果它是一个问题的基础，但我真的找不到一个在SHILLT和Internet上都不能提出来的问题。 < P>是的，C++中的和< /COD>操作符使用，如果 BoOL1评估为 false ，不麻烦评估 BOOL2 < < /P>
									C++
							 
C++ 用欧几里德算法求GCF（GCD）
									C++
							 									Algorithm
							 
C++ 调用delete[]会中断我的C++；程序
									C++
							 									Arrays
							 									Memory
							 									Dynamic
							 
C++ 创建C++；动态库并在Mac和XCode上使用
									C++
							 									Xcode
							 									Dll
							 
C++ 转换C++；dll注入到unicode中
									C++
							 									Dll
							 									Unicode
							 
C++ 如何使用googletest/googlemock框架测试连续/相关更改？
									C++
							 
C++ 如何清除（字符串）流上的所有粘性操纵器？
									C++
							 
C++ 对于以下内容，我们需要多少运算符重载？
									C++
							 
C++ 在c++；
									C++
							 									Vector
							 
C++ 如何重写以下代码以使其更易于测试？
									C++
							 									Testing
							 
C++；继承：指向基类的派生类指针调用派生类方法
我正在学习C++继承，所以我通过创建一个基类动态地尝试了这个代码，并对它的派生类进行了一个下沉（显然它对下沉是无效的），以便使这个动态创建的基础对象被派生类指针所指向。但是当我通过这个派生指针调用一个方法who（）时，它调用的是派生类方法，而不是基类方法
									C++
							 									Pointers
							 									Inheritance
							 
C++ C+中关键字new的解释+；
									C++
							 
C++ 通过宏的内联函数
									C++
							 									C
							 									Optimization
							 									Macros
							 
C++ stl数据结构中智能指针的用例
									C++
							 									C++11
							 
C++ 编译c++；针对静态或动态库的链接
									C++
							 
C++ 使用递归的二维链表复制构造函数
									C++
							 									Recursion
							 
C++ 我的彼得森锁在这种情况下失灵了
									C++
							 
C++ 使用互斥锁同步2个进程
									C++
							 									Winapi
							 
构建Linux C++；使用VST
我试图用VSTS构建Linux的C++应用程序。构建由Docker容器模板定义，代理队列由Linux托管
									C++
							 									Linux
							 									Docker
							 									Azure Devops
							 
C++ 在这个赋值中遇到问题，我们需要使用指针和数组来查找文本文件中某些数字的平均值、中值和模式
									C++
							 
如何将类转换为命名空间
我有一个C++类，我想转换成命名空间
我试着在google上四处寻找，但我找不到任何能使我的类成为名称空间的解决方案。
我该怎么做？它是一个包含3个函数的类。
例如：
class c
{
public:
    void A();
    void B();
    void X();
}
									C++
							 									Class
							 
C++ 为什么在C++；？
									C++
							 
C++ 有没有办法传递普通函数和调用模板函数？
#包括
使用名称空间std；
模板
无效显示（T a）{
a+=a；
你可以这样说：
#include<iostream>
using namespace std;

template<class T>
void display(T a){
    a += a;
    cout << "Template Function: " << a << endl;
}

templat
									C++
							 
C++ 显式类型转换真的有必要吗？
									C++
							 
运算符在C+中是什么意思+；遗产
我一直在阅读C++中的继承，注意到
class Car: public Vehicle {
  public:
    string model = "Mustang";
};
									C++
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Actions On Google
Caching
Openid
Combobox
Html
Sharepoint 2007
Android Layout
Ember.js
Crystal Reports
C#
Webpack
Python
Applescript
Configuration
Windows Installer
Pascal
Laravel
Mapping
Visual Studio 2013
Boost
D3.js
Symfony1
Socket.io
Memory
Graph
Python 3.x
Telegram
Error Handling
Scala
Login
Android Fragments
Automation
Activemq
Telerik
Oracle
Kdb
Passwords
Camera
Wso2
Azure Cosmosdb
Hyperledger Fabric
Graphviz
Workflow
Mpi
Path
Image
Google Chrome
Tensorflow
Interface
Download
Chart.js
Binary
Variables
Lambda
Apache Pig
Microservices
Documentation
Devexpress
Menu
Mobile
Vhdl
Erlang
Replace
Playframework 2.0
Binding
Oracle10g
Tomcat
Reporting Services
Ios4
Timer
Data Structures
Xampp
Entity Framework Core
Jekyll
Sequelize.js
Drupal 6
Frameworks
Grid
.net 4.0
Zsh
Exchange Server
Testng
Windbg
Linq
Firebase
Postgresql
Pytorch
Glassfish
Openstack
Mono
Iframe
Ubuntu
Odata
Antlr4
Exception Handling
User Interface
E Commerce
Webgl
Optimization
Linux
Dotnetnuke
Post
Regex
Oauth 2.0
Swagger
C
Printing
Vector
Routes
Spring Boot
Installation
Racket
Speech Recognition
Google Chrome Extension
Module
Chef Infra
Autodesk Forge
Hazelcast
Orientdb
Raspberry Pi
Triggers
Openshift
Codenameone
Ssrs 2008
Apache Storm
Vmware
Signalr
Cuda
Verilog
Windows Phone 8
Umbraco
Discord
Gruntjs
Ibm Cloud
Apache Zookeeper
Types
Encoding
Arduino
Lotus Notes
Notepad++
Svg
Solr
Twig
Zend Framework
Haskell
Nlp
Join
Gis
Wix
Cron
Elixir
Cygwin
Gstreamer
Ios
Razor
Cakephp
Jira
Kernel
Google Bigquery
Netbeans
Jersey
Perl
Mapreduce
Push Notification
Knockout.js
Select
Gatsby
Qml
Routing
Gremlin
Actionscript 3
Octave
Notifications
Stata
Netlogo
Sass
Windows Mobile
Azure Functions
Jar
Uiview
Serialization
Angularjs
Vaadin
Vue.js
Windows 8
Dependency Injection
Iis 7
Dynamic
Cmake
Jquery Ui
Asp.net Mvc 3
Compiler Construction
Amazon Dynamodb
Winforms
Omnet++
Virtual Machine
Jhipster
Recursion
Redux
Itext
Animation


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网