目录
一、问题
二、中文乱码原因分析
1、QString
2、乱码分析
三、Qt4中文乱码的解决
四、Qt4升级到Qt5中文乱码的解决
1、fromLocal8Bit
2、QStringLiteral
Qt4升级到Qt5由于setCodecForLocale(), setCodecForCStrings()和setCodecForTr()函数无法使用会带来一些乱码的问题。
The QString class provides a Unicode character string.
QString stores a string of 16-bit QChars, where each QChar corresponds one Unicode 4.0 character. (Unicode characters with code values above 65535 are stored using surrogate pairs, i.e., two consecutive QChars.)
Unicode is an international standard that supports most of the writing systems in use today. It is a superset of US-ASCII (ANSI X3.4-1986) and Latin-1 (ISO 8859-1), and all the US-ASCII/Latin-1 characters are available at the same code positions.
Behind the scenes, QString uses implicit sharing (copy-on-write) to reduce memory usage and to avoid the needless copying of data. This also helps reduce the inherent overhead of storing 16-bit characters instead of 8-bit characters.
In addition to QString, Qt also provides the QByteArray class to store raw bytes and traditional 8-bit '\0'-terminated strings. For most purposes, QString is the class you want to use. It is used throughout the Qt API, and the Unicode support ensures that your applications will be easy to translate if you want to expand your application's market at some point. The two main cases where QByteArray is appropriate are when you need to store raw binary data, and when memory conservation is critical (e.g., with Qt for Embedded Linux).
无论Qt4还是Qt5,QString内部都是以Unicode字符进行存储的,所有对QString进行赋值时都会先进行字符编码转换。
QString 内部采用的是Unicode。QString内部采用的是 Unicode,它可以同时存放GBK中的字符"我是汉字",BIG5中的字符"扂岆犖趼" 以及Latin-1中的字符"ÎÒÊǺº×Ö"。
一个问题是,“我是汉字”,该怎么转换成Unicode并存到 QString 内?按照GBK、BIG5、Latin-1还是其他方式。在你不告诉它的情况下,它默认选择了Latin-1,于是“我是汉字“以Latin-1的转换到unicode码的方式被存进了QString中。最终在你期盼看到4中文字符的地方,所谓的乱码出现了。
const char * str = “我是汉字”;
QString a= str;
其实很简单的一个问题,当你需要从窄字符串 char* 转成Unicode的QString字符串的,你需要告诉QString你的这串char* 中究竟是什么编码?GBK、BIG5、Latin-1理想情况就是:将char* 传给QString时,同时告诉QString自己的编码是什么:就像下面的函数一样,QString的成员函数知道按照何种编码来处理 C 字符串。
QString QString::fromAscii ( const char * str, int size = -1 )
QString QString::fromLatin1 ( const char * str, int size = -1 )
QString QString::fromLocal8Bit ( const char * str, int size = -1 )
QString QString::fromUtf8 ( const char * str, int size = -1 )
Qt4可以设置这种字符编码转换方式。The GBK codec provides conversion to and from the Chinese GB18030/GBK/GB2312 encoding.
QTextCodec *codec = QTextCodec::codecForName("GB2312");QTextCodec::setCodecForLocale(codec);QTextCodec::setCodecForCStrings(codec);QTextCodec::setCodecForTr(codec);
#include
int main(int argc, char **argv)
{......// 以下部分解决中文乱码QTextCodec *codec = QTextCodec::codecForName("GB2312"); //windowsQTextCodec::setCodecForTr(codec);QTextCodec::setCodecForLocale(codec);QTextCodec::setCodecForCStrings(codec);// 以上部分解决中文乱码......
}
Qt fromLocal8Bit()函数可以设置编码。QT默认的编码是unicode,不能显示中文的,windows默认使用(GBK/GB2312/GB18030),使用fromLocal8Bit()函数,实现了从本地字符集到Unicode的转换,用于处理汉语显示乱码等问题。
static QString fromLocal8Bit( const char * str, int size = -1 );//该函数返回的是String类型的数static QString::toLocal8Bit () ;//转换到本地编码字符串
不得不提最后一种比较高级的方法:QStringLiteral宏它可以直接生成Unicode字符串保存在可执行文件中的只读区域。这样运行时不会发生任何转换。可以显著提高程序运行效率。但是QStringLiteral需要编译器支持,如支持C++11就具有这种特性。Qt高版本一般也支持。具体性能方面的影响请看Qt的帮助文档。但它只能处理常量。