*（星号）和 ** 双星号在 Python 中是什么意思？

Question

MaximPro

Asked:2020-11-24 16:01:51 +0000 UTC2020-11-24 16:01:51 +0000 UTC 2020-11-24 16:01:51 +0000 UTC

获取utf-8字符编码

772

也许这是一个很愚蠢的问题，但我没有找到返回 UTF-8 字符编码的函数。

我知道我们可以用下面的代码得到ASCII码：

char our_symbol = 'v';
int number;
number = (int) our_symbol;

如何从 UTF-8 获取代码？

澄清：我们想知道一个字符代码序列。

假设这个字符'а'是西里尔字符。

如果我们将它的字节翻译成十进制代码，我们得到1байт - 208, 2байт - 176

3 个回答

Voted

ixSci · Answer 1 · 2020-11-24T16:27:56Z

Best Answer

ixSci

2020-11-24T16:27:56Z2020-11-24T16:27:56Z

这是一个简单而精致的版本：

std::string utf8Symbol = u8"Ф";
for(const auto& byte : utf8Symbol)
    std::cout << std::hex << (byte & 0xFF) << ' ';
std::cout << '\n';

这与单字节编码几乎没有区别：如果您已经有了提取单个字符的方法，您只需获取每个字符并一个接一个地提取所有字节。

6

Qwertiy · Answer 2 · 2020-11-24T17:59:19Z

Qwertiy

2020-11-24T17:59:19Z2020-11-24T17:59:19Z

http://ideone.com/5IdxoG

#include <cstdio>

int main()
{
    const char *str = u8"Я строка в UTF-8. がダウンロードできません";

    printf("%s", str);

    for (unsigned char *p=(unsigned char *)str; *p; ++p)
        printf(*p >> 6 == 2 ? " %.02X" : "\n%.02X", *p);

    return 0;
}

这使用了这样一个事实，即对于除第一个字节之外的所有字节，两个最高有效位都是 10。

4

Majestio · Answer 3 · 2020-11-24T18:12:30Z

Majestio

2020-11-24T18:12:30Z2020-11-24T18:12:30Z

好吧，除了 UCS-2 -> UTF8 -> 代码 :)

毕竟，您可以用不同的方式在代码中存储字符串...... http://ideone.com/bkNiH5：

#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
#include <iomanip>

int main() {
    // широкие символы
    std::wstring wstr = L"Я строка в UCS-2. がダウンロードできません";
    // широкие символы в UTF-8
    std::wstring_convert<std::codecvt_utf8<wchar_t>> conv;
    std::cout << "Chr | UTF-8\n============\n";
    for(const auto &c:wstr) {
      std::string u8str = conv.to_bytes(c);        
      std::cout << u8str << "   : ";  
      for(const uint8_t &i:u8str) 
      std::cout << std::hex << std::setfill('0') << std::setw(2) << static_cast<int>(i) << ' ';
      std::cout << std::dec << '\n';  
    }
    return 0;
}

2

获取utf-8字符编码

如何停止编写糟糕的代码？

onCreateView 方法重构

通用还是非通用

如何访问 jQuery 中的列

*.tga 文件的组重命名（3620 个）

内存分配列表C#

常规赛适度贪婪

如何制作自己的自动完成/自动更正？

选择斐波那契数列

所有 API 版本中的通用权限代码

获取utf-8字符编码

3 个回答

相关问题