也许这是一个很愚蠢的问题,但我没有找到返回 UTF-8 字符编码的函数。
我知道我们可以用下面的代码得到ASCII码:
char our_symbol = 'v';
int number;
number = (int) our_symbol;
如何从 UTF-8 获取代码?
澄清:我们想知道一个字符代码序列。
假设这个字符'а'
是西里尔字符。
如果我们将它的字节翻译成十进制代码,我们得到1байт - 208, 2байт - 176
也许这是一个很愚蠢的问题,但我没有找到返回 UTF-8 字符编码的函数。
我知道我们可以用下面的代码得到ASCII码:
char our_symbol = 'v';
int number;
number = (int) our_symbol;
如何从 UTF-8 获取代码?
澄清:我们想知道一个字符代码序列。
假设这个字符'а'
是西里尔字符。
如果我们将它的字节翻译成十进制代码,我们得到1байт - 208, 2байт - 176
这是一个简单而精致的版本:
这与单字节编码几乎没有区别:如果您已经有了提取单个字符的方法,您只需获取每个字符并一个接一个地提取所有字节。
http://ideone.com/5IdxoG
这使用了这样一个事实,即对于除第一个字节之外的所有字节,两个最高有效位都是 10。
好吧,除了 UCS-2 -> UTF8 -> 代码 :)
毕竟,您可以用不同的方式在代码中存储字符串...... http://ideone.com/bkNiH5: