Linux   发布时间:2022-04-01  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了c – 处理UTF-8字符串大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

概述

据我所知,linux使用UTF-8编码.这意味着我可以使用std :: String来处理字符串吗?只是编码将是UTF-8.现在在UTF-8上我们知道一些字符是1字节,一些2,3 ..字节.我的问题是:如何使用C在Linux上处理UTF-8编码的字符串?特别是:如何获得字符串的长度(以字节为单位)(或字符数)?你将如何遍历字符串?等等我问的原因是,正如我所说

据我所知,linux使用UTF-8编码.
这意味着我可以使用std :: String来处理字符串吗?
只是编码将是UTF-8.

现在在UTF-8上我们知道一些字符是1字节,一些2,3 ..字节.
我的问题是:如何使用C在Linux上处理UTF-8编码的字符串?

特别是:如何获得字符串的长度(以字节为单位)(或字符数)?你将如何遍历字符串?等等

我问的原因是,正如我所说的UTF-8字符可能超过一个字节对吗?
显然myString [7]和MyString [8] – 可能不会引用两个不同的字符.
另外事实上UTF-8字符串是十个字节,对它的字符数说不多了吧?

最佳答案
无法使用std :: String处理UTF-8.尽管名称是字符串,但它只是(多)字节的容器.它不是文本存储的类型(除了字节缓冲区显然可以存储任何对象,包括文本).它甚至不存储字符(char是一个字节,而不是字符).

如果要实际处理(而不是仅存储)Unicode字符,则需要在标准库外部进行冒险.传统上,这是由诸如ICU之类的库完成的.

然而,然这是一个成熟的库,但它的C接口很糟糕.在Ogonek中采用了一种现代化的方法.它并没有很好地建立并且仍在进行中,但提供了更好的界面.

大佬总结

以上是大佬教程为你收集整理的c – 处理UTF-8字符串全部内容,希望文章能够帮你解决c – 处理UTF-8字符串所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。