命名空间
变体
操作

scanf, fscanf, sscanf, scanf_s, fscanf_s, sscanf_s

来自 cppreference.cn
< c‎ | io
 
 
文件输入/输出
类型和对象
        
函数
文件访问
(C95)
非格式化输入/输出
(C95)(C95)
(C95)
(C95)(C95)
(C95)
(C95)

格式化输入
scanffscanfsscanfscanf_sfscanf_ssscanf_s
(C11)(C11)(C11)
 
定义于头文件 <stdio.h>
(1)
int scanf( const char          *format, ... );
(直到 C99)
int scanf( const char *restrict format, ... );
(C99 起)
(2)
int fscanf( FILE          *stream, const char          *format, ... );
(直到 C99)
int fscanf( FILE *restrict stream, const char *restrict format, ... );
(C99 起)
(3)
int sscanf( const char          *buffer, const char          *format, ... );
(直到 C99)
int sscanf( const char *restrict buffer, const char *restrict format, ... );
(C99 起)
int scanf_s(const char *restrict format, ...);
(4) (C11 起)
int fscanf_s(FILE *restrict stream, const char *restrict format, ...);
(5) (C11 起)
int sscanf_s(const char *restrict buffer, const char *restrict format, ...);
(6) (C11 起)

从各种来源读取数据,根据format解释数据并将其存储到给定位置。

1)stdin 读取数据
2) 从文件流 stream 读取数据
3) 从以空字符结尾的字符串 buffer 读取数据。到达字符串末尾相当于 fscanf 的文件结束条件
4-6)(1-3) 相同,但 %c%s%[ 转换说明符各需要两个参数(通常的指针和 rsize_t 类型的值,表示接收数组的大小,当用 %c 读取单个字符时,该值可以是 1),并且在运行时检测到以下错误并调用当前安装的约束处理函数
  • 任何指针类型的参数为空指针
  • `format`、`stream` 或 `buffer` 为空指针
  • %c%s%[ 写入的字符数,加上终止空字符,将超出为这些转换说明符提供的第二个 (rsize_t) 参数
  • 可选地,任何其他可检测的错误,例如未知转换说明符
与所有边界检查函数一样,只有当实现定义了 __STDC_LIB_EXT1__ 并且用户在包含 <stdio.h> 之前将 __STDC_WANT_LIB_EXT1__ 定义为整数常量 1 时,才能保证 scanf_sfscanf_ssscanf_s 可用。

目录

[编辑] 参数

stream - 要从中读取的输入文件流
buffer - 指向要从中读取的以空字符结尾的字符串的指针
format - 指向以空字符结尾的字符串的指针,指定如何读取输入
... - 接收参数。


format 字符串由以下部分组成:

  • 非空白多字节字符(除了 %):格式字符串中的每个此类字符都从输入流中消耗一个完全相同的字符,如果流中的下一个字符不相等,则导致函数失败。
  • 空白字符:格式字符串中的任何单个空白字符都从输入中消耗所有可用的连续空白字符(通过循环调用 isspace 确定)。请注意,格式字符串中的 "\n"" ""\t\t" 或其他空白没有区别。
  • 转换说明符。每个转换说明符具有以下格式:
  • 开头的 % 字符。
  • (可选) 赋值抑制字符 *。如果此选项存在,函数不会将转换结果赋值给任何接收参数。
  • (可选) 整数(大于零),指定最大字段宽度,即函数在执行当前转换说明指定的转换时允许消耗的最大字符数。请注意,如果未提供宽度,%s%[ 可能会导致缓冲区溢出。
  • (可选) 长度修饰符,指定接收参数的大小,即实际目标类型。这会影响转换精度和溢出规则。每个转换类型的默认目标类型不同(见下表)。
  • 转换格式说明符。

以下格式说明符可用:

转换
说明符
解释 预期
参数类型
长度修饰符→ hh h l ll j z t L
仅在 C99 之后可用→
%
匹配字面量 `%`。
不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用
c

匹配一个字符或一系列字符

  • 如果使用宽度说明符,则精确匹配 *width* 个字符(参数必须是指向具有足够空间的数组的指针)。
  • 与 %s 和 %[ 不同,不会在数组末尾添加空字符。
不适用 不适用
char*
wchar_t*
不适用 不适用 不适用 不适用 不适用
s

匹配一系列非空白字符(一个字符串)。

  • 如果使用宽度说明符,则匹配最多 *width* 个字符或直到第一个空白字符,以先出现的为准。
  • 除了匹配的字符外,始终存储一个空字符(因此参数数组必须至少有 *width+1* 个字符的空间)。
[ ]

匹配来自字符 set 的非空字符序列。

  • 如果集合的第一个字符是 `^`,则匹配集合中不包含的所有字符。
  • 如果集合以 `]` 或 `^]` 开头,则 `]` 字符也包含在集合中。
  • 在扫描集中非起始位置的字符 `-` 是否表示范围(如 `[0-9]`)是实现定义的。
  • 如果使用宽度说明符,则只匹配最多 *width* 个字符。
  • 除了匹配的字符外,始终存储一个空字符(因此参数数组必须至少有 *width+1* 个字符的空间)。
d

匹配一个十进制整数

  • 数字的格式与 strtol 期望的相同,base 参数值为 10
signed char*unsigned char*
signed short*unsigned short*
signed int*unsigned int*
signed long*unsigned long*
signed long long*unsigned long long*
不适用
i

匹配一个整数

  • 数字的格式与 strtol 期望的相同,base 参数值为 0 (基数由解析的第一个字符确定)。
u

匹配一个无符号十进制整数

  • 数字的格式与 strtoul 期望的相同,base 参数值为 10
o

匹配一个无符号八进制整数

  • 数字的格式与 strtoul 期望的相同,base 参数值为 8
x
X

匹配一个无符号十六进制整数

  • 数字的格式与 strtoul 期望的相同,base 参数值为 16
n

返回目前读取的字符数

  • 不消耗输入。不增加赋值计数。
  • 如果说明符定义了赋值抑制运算符,则行为是未定义的。
a (C99)
A (C99)
e
E
f
F (C99)
g
G

匹配一个浮点数

  • 数字的格式与 strtof 期望的相同。
不适用 不适用
float*
double*
不适用 不适用 不适用 不适用
long double*
p

匹配定义指针的实现定义的字符序列。

  • `printf` 函数族应使用 `%p` 格式说明符生成相同的序列。
不适用 不适用
void**
不适用 不适用 不适用 不适用 不适用 不适用
注意

对于除了 n 之外的每个转换说明符,从流中消耗的最长输入字符序列,其不超过任何指定的字段宽度且要么与转换说明符期望的完全相同,要么是其期望序列的前缀。此消耗序列之后的第一个字符(如果有)保持未读。如果消耗序列长度为零,或者消耗序列无法按上述指定转换,则发生匹配失败,除非文件结束、编码错误或读取错误阻止了流输入,在这种情况下是输入失败。

除了 [cn 之外的所有转换说明符,在尝试解析输入之前都会消耗并丢弃所有前导空白字符(通过调用 isspace 确定)。这些消耗的字符不计入指定的最大字段宽度。

转换说明符 lclsl[ 执行多字节到宽字符的转换,就像在转换第一个字符之前调用 mbrtowc 并使用初始化为零的 mbstate_t 对象一样。

转换说明符 s[ 除了匹配的字符外,总是存储空终止符。目标数组的大小必须至少比指定的字段宽度大一。使用 %s%[ 而不指定目标数组大小与 gets 一样不安全。

定宽整数类型 (int8_t 等) 的正确转换说明符定义在头文件 <inttypes.h> 中(尽管 SCNdMAXSCNuMAX 等是 %jd%ju 等的同义词)。

每个转换说明符的操作之后都有一个序列点;这允许在同一个“接收”变量中存储多个字段。

当解析一个不完整的浮点值,该值以指数结尾且没有数字时,例如使用转换说明符 %f 解析 "100er",序列 "100e"(可能是有效浮点数的最长前缀)被消耗,导致匹配错误(消耗的序列无法转换为浮点数),留下 "r"。一些现有的实现不遵循此规则,而是回滚只消耗 "100",留下 "er",例如,glibc bug 1765

如果转换说明符无效,则行为未定义。

如果转换说明符无效,则行为未定义。

[编辑] 返回值

1-3) 成功赋值的接收参数数量(如果在第一个接收参数赋值之前发生匹配失败,则可能为零),如果在第一个接收参数赋值之前发生输入失败,则为 EOF
4-6)(1-3) 相同,但如果存在运行时约束违规,也返回 EOF

[编辑] 复杂度

不保证。值得注意的是,一些 sscanf 的实现是 O(N),其中 N = strlen(buffer) [1]

[编辑] 注意

因为大多数转换说明符首先消耗所有连续的空白字符,所以诸如

scanf("%d", &a);
scanf("%d", &b);

的代码将读取在不同行(第二个 %d 将消耗第一个留下的换行符)或同一行,用空格或制表符分隔的两个整数(第二个 %d 将消耗空格或制表符)。

不消耗前导空白字符的转换说明符,例如 %c,可以通过在格式字符串中使用空白字符来使其消耗前导空白字符
scanf("%d", &a);
scanf(" %c", &c); // consume all consecutive whitespace after %d, then read a char

[编辑] 示例

#define __STDC_WANT_LIB_EXT1__ 1
#include <stdio.h>
#include <stddef.h>
#include <locale.h>
 
int main(void)
{
    int i, j;
    float x, y;
    char str1[10], str2[4];
    wchar_t warr[2];
    setlocale(LC_ALL, "en_US.utf8");
 
    char input[] = "25 54.32E-1 Thompson 56789 0123 56ß水";
    /* parse as follows:
       %d: an integer
       %f: a floating-point value
       %9s: a string of at most 9 non-whitespace characters
       %2d: two-digit integer (digits 5 and 6)
       %f:  a floating-point value (digits 7, 8, 9)
       %*d: an integer which isn't stored anywhere
       ' ': all consecutive whitespace
       %3[0-9]: a string of at most 3 decimal digits (digits 5 and 6)
       %2lc: two wide characters, using multibyte to wide conversion  */
    int ret = sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc",
                     &i, &x, str1, &j, &y, str2, warr);
 
    printf("Converted %d fields:\n"
           "i = %d\n"
           "x = %f\n"
           "str1 = %s\n"
           "j = %d\n"
           "y = %f\n"
           "str2 = %s\n"
           "warr[0] = U+%x\n"
           "warr[1] = U+%x\n",
           ret, i, x, str1, j, y, str2, warr[0], warr[1]);
 
#ifdef __STDC_LIB_EXT1__
    int n = sscanf_s(input, "%d%f%s", &i, &x, str1, (rsize_t)sizeof str1);
    // writes 25 to i, 5.432 to x, the 9 bytes "Thompson\0" to str1, and 3 to n.
#endif
}

可能的输出

Converted 7 fields:
i = 25
x = 5.432000
str1 = Thompson
j = 56
y = 789.000000
str2 = 56
warr[0] = U+df
warr[1] = U+6c34

[编辑] 参考

  • C17 标准 (ISO/IEC 9899:2018)
  • 7.21.6.2 fscanf 函数 (p: 231-236)
  • 7.21.6.4 scanf 函数 (p: 236-237)
  • 7.21.6.7 sscanf 函数 (p: 238-239)
  • K.3.5.3.2 fscanf_s 函数 (p: 430-431)
  • K.3.5.3.4 scanf_s 函数 (p: 432)
  • K.3.5.3.7 sscanf_s 函数 (p: 433)
  • C11 标准 (ISO/IEC 9899:2011)
  • 7.21.6.2 fscanf 函数 (p: 317-324)
  • 7.21.6.4 scanf 函数 (p: 325)
  • 7.21.6.7 sscanf 函数 (p: 326)
  • K.3.5.3.2 fscanf_s 函数 (p: 592-593)
  • K.3.5.3.4 scanf_s 函数 (p: 594)
  • K.3.5.3.7 sscanf_s 函数 (p: 596)
  • C99 标准 (ISO/IEC 9899:1999)
  • 7.19.6.2 fscanf 函数 (p: 282-289)
  • 7.19.6.4 scanf 函数 (p: 290)
  • 7.19.6.7 sscanf 函数 (p: 291)
  • C89/C90 标准 (ISO/IEC 9899:1990)
  • 4.9.6.2 fscanf 函数
  • 4.9.6.4 scanf 函数
  • 4.9.6.6 sscanf 函数

[编辑] 另见

stdin、文件流或缓冲区读取格式化输入
使用可变参数列表
(函数) [编辑]
从文件流获取字符字符串
(函数) [编辑]
将格式化输出打印到 stdout、文件流或缓冲区
(函数) [编辑]
C++ 文档 用于 scanf, fscanf, sscanf