命名空间
变体
操作

std::wcsrtombs

来自 cppreference.cn
< cpp‎ | string‎ | multibyte
定义于头文件 <cwchar>
std::size_t wcsrtombs( char* dst,

                       const wchar_t** src,
                       std::size_t len,

                       std::mbstate_t* ps );

将宽字符序列从数组(其首元素由 *src 指向)转换为窄多字节表示形式,转换从 *ps 描述的转换状态开始。如果 dst 非空,则转换后的字符存储在 dst 指向的 char 数组的连续元素中。写入目标数组的字节数不超过 len 字节。

每个字符都如同调用 std::wcrtomb 进行转换。转换在以下情况停止:

  • 空字符被转换并存储。src 被设置为 null 指针,且 *ps 表示初始移位状态。
  • 找到一个 wchar_t,它在当前 C locale 中不对应于有效的字符。src 被设置为指向第一个未转换的宽字符。
  • 下一个要存储的多字节字符将超出 lensrc 被设置为指向第一个未转换的宽字符。如果 dst 是 null 指针,则不检查此条件。

目录

[edit] 参数

dst - 指向将存储多字节字符的窄字符数组的指针
src - 指向指向空终止宽字符串的首元素的指针的指针
len - dst 指向的数组中可用的字节数
ps - 指向转换状态对象的指针

[edit] 返回值

成功时,返回写入到字符数组(其首元素由 dst 指向)的字节数(包括任何移位序列,但不包括终止符 '\0')。如果 dst 是 null 指针,则返回本应写入的字节数(同样,不包括终止空字符 '\0')。

在转换错误时(如果遇到无效的宽字符),返回 static_cast<std::size_t>(-1),在 EILSEQ 中存储 errno,并将 *ps 置于未指定状态。

[edit] 示例

#include <clocale>
#include <cwchar>
#include <iostream>
#include <string>
#include <vector>
 
void print_wide(const wchar_t* wstr)
{
    std::mbstate_t state = std::mbstate_t();
    std::size_t len = 1 + std::wcsrtombs(nullptr, &wstr, 0, &state);
    std::vector<char> mbstr(len);
    std::wcsrtombs(&mbstr[0], &wstr, mbstr.size(), &state);
    std::cout << "multibyte string: " << &mbstr[0] << '\n'
              << "Length, including '\\0': " << mbstr.size() << '\n';
}
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const wchar_t* wstr = L"z\u00df\u6c34\U0001d10b"; // or L"zß水𝄋"
    print_wide(wstr);
}

输出

multibyte string: zß水𝄋
Length, including '\0': 11

[edit] 参见

给定状态,将宽字符转换为其多字节表示形式
(函数) [edit]
给定状态,将窄多字节字符串转换为宽字符串
(函数) [edit]
[虚函数]
将字符串从 InternT 转换为 ExternT,例如在写入文件时
(std::codecvt<InternT,ExternT,StateT> 的虚保护成员函数) [edit]
wcsrtombs 的 C 文档