命名空间
变体
操作

c8rtomb

来自 cppreference.cn
< c‎ | string‎ | multibyte
定义于头文件 <uchar.h>
size_t c8rtomb( char* restrict s, char8_t c8, mbstate_t* restrict ps );
(自 C23 起)

将来自 UTF-8 的单个代码点转换为窄多字节字符表示。

如果 s 不是空指针且 c8 是有效 UTF-8 编码的代码点中的最后一个代码单元,则该函数确定存储该代码点的多字节字符表示所需的字节数(包括任何移位序列,并考虑当前多字节转换状态 *ps),并将多字节字符表示存储在字符数组中,该数组的第一个元素由 s 指向,并根据需要更新 *ps。此函数最多可以写入 MB_CUR_MAX 个字节。

如果 c8 不是代码点表示中的最后一个 UTF-8 代码单元,则该函数不会写入由 s 指向的数组,仅更新 *ps

如果 s 是空指针,则调用等效于 c8rtomb(buf, u8'\0', ps),其中 buf 是某个内部缓冲区。

如果 c8 是空字符 u8'\0',则存储一个空字节,其前面是恢复初始移位状态所需的任何移位序列,并且转换状态参数 *ps 将更新以表示初始移位状态。

此函数使用的多字节编码由当前活动的 C 本地环境指定。

目录

[编辑] 参数

s - 指向将存储多字节字符的窄字符数组的指针
c8 - 要转换的 UTF-8 代码单元
ps - 指向在解释多字节字符串时使用的转换状态对象的指针

[编辑] 返回值

存储在数组对象中的字节数(包括任何移位序列)。当 c8 不是代码点的 UTF-8 表示中的最后一个代码单元时,这可能为零。

如果 c8 无效(不对 char8_t 序列做出贡献,而该序列对应于有效的多字节字符),则宏 EILSEQ 的值存储在 errno 中,返回 (size_t)-1,并且转换状态未指定。

[编辑] 注意

使用空指针参数 s 调用 c8rtomb 可能会引入数据竞争,与其他使用空指针参数 s 调用 c8rtomb 的情况。

[编辑] 示例

[编辑] 参考文献

  • C23 标准 (ISO/IEC 9899:2024)
  • 7.30.1.2 c8rtomb 函数

[编辑] 参见

将窄多字节字符转换为 UTF-8 编码
(函数) [编辑]
C++ 文档 关于 c8rtomb