命名空间
变体
操作

std::c8rtomb

来自 cppreference.com
< cpp‎ | string‎ | multibyte
定义在头文件 <cuchar>
std::size_t c8rtomb( char* s, char8_t c8, std::mbstate_t* ps );
(自 C++20 起)

将单个代码点从 UTF-8 转换为窄多字节字符表示。

如果 s 不是空指针,并且 c8 是代码点的有效 UTF-8 编码中的最后一个代码单元,则该函数确定存储该代码点的多字节字符表示所需的字节数(包括任何移位序列,并考虑当前多字节转换状态 *ps),并将多字节字符表示存储在第一个元素由 s 指向的字符数组中,根据需要更新 *ps。此函数最多可以写入 MB_CUR_MAX 字节。

如果 c8 不是代码点表示中的最终 UTF-8 代码单元,则该函数不会写入由 s 指向的数组,只有 *ps 会更新。

如果 s 是空指针,则调用等效于 std::c8rtomb(buf, u8'\0', ps) 用于某些内部缓冲区 buf

如果 c8 是空字符 u8'\0',则存储一个空字节,在其前面是恢复初始移位状态所需的任何移位序列,并且转换状态参数 *ps 被更新为表示初始移位状态。

此函数使用的多字节编码由当前活动的 C 区域设置指定。

内容

[编辑] 参数

s - 指向将存储多字节字符的窄字符数组的指针
c8 - 要转换的 UTF-8 代码单元
ps - 指向在解释多字节字符串时使用的转换状态对象的指针

[编辑] 返回值

存储在数组对象中的字节数(包括任何移位序列)。当 c8 不是代码点 UTF-8 表示中的最终代码单元时,这可能是零。

如果 c8 无效(对 char8_t 的序列不起作用,该序列对应于有效的多字节字符),则宏 EILSEQ 的值存储在 errno 中,返回 static_cast<std::size_t>(-1),并且转换状态未指定。

[编辑] 注释

调用带有 s 的空指针参数的 c8rtomb 可能在对带有 s 的空指针参数的 c8rtomb 的其他调用中引入数据竞争。

[编辑] 示例

[编辑] 另请参阅

(C++20)
将窄多字节字符转换为 UTF-8 编码
(函数) [编辑]
C 文档 for c8rtomb