25.C语言标准库函数(下)

14.string

以下字符串处理函数,详见C语言字符串

  • strcpy():复制字符串。
  • strncpy():复制字符串,有长度限制。
  • strcat():连接两个字符串。
  • strncat():连接两个字符串,有长度限制。
  • strcmp():比较两个字符串。
  • strncmp():比较两个字符串,有长度限制。
  • strlen():返回字符串的字节数。

strchr()strrchr()都用于在字符串中查找指定字符,不同之处是,strchr()从字符串开头开始查找,strrchr()从字符串结尾开始查找,函数名里面多出来的那个r表示 reverse(反向)。

char* strchr(char* str, int c);
char* strrchr(char *str, int c);

它们都接受两个参数,第一个参数是字符串指针,第二个参数是所要查找的字符。

一旦找到该字符,它们就会停止查找,并返回指向该字符的指针。如果没有找到,则返回 NULL。

下面是一个例子:

char *str = "Hello, world!";
char *p;

p = strchr(str, ',');  // p 指向逗号的位置
p = strrchr(str, 'o'); // p 指向 world 里面 o 的位置

strspn()用来查找属于指定字符集的字符串长度,strcspn()正好相反,用来查找不属于指定字符集的字符串长度:

size_t strspn(char* str, const char* accept);
size_t strcspn(char *str, const char *reject);

这两个函数接受两个参数,第一个参数是源字符串,第二个参数是由指定字符组成的字符串。

strspn()从第一个参数的开头开始查找,一旦发现第一个不属于指定字符集范围的字符,就停止查找,返回到目前为止的字符串长度。如果始终没有不在指定字符集的字符,则返回第一个参数字符串的长度。

strcspn()则是一旦发现第一个属于指定字符集范围的字符,就停止查找,返回到目前为止的字符串长度。如果始终没有发现指定字符集的字符,则返回第一个参数字符串的长度:

char str[] = "hello world";
int n;

n = strspn(str1, "aeiou");
printf("%d\n", n);  // n == 0

n = strcspn(str1, "aeiou");
printf("%d\n", n); // n == 1

上面示例中,第一个n等于0,因为0号位置的字符h就不属于指定字符集aeiou,可以理解为开头有0个字符属于指定字符集。

第二个n等于1,因为1号位置的字符e属于指定字符集aeiou,可以理解为开头有1个字符不属于指定字符集。

strpbrk()在字符串中搜索指定字符集的任一个字符:

char* strpbrk(const char* s1, const char* s2);

它接受两个参数,第一个参数是源字符串,第二个参数是由指定字符组成的字符串。

它返回一个指向第一个匹配字符的指针,如果未找到匹配字符,则返回 NULL:

char* s1 = "Hello, world!";
char* s2 = "dow!";

char* p = strpbrk(s1, s2);

printf("%s\n", p);  // "o, world!"

上面示例中,指定字符集是“dow!”,那么s1里面第一个匹配字符是“Hello”的“o”,所以指针p指向这个字符。输出的话,就会输出从这个字符直到字符串末尾的“o, world!”。

strstr()在一个字符串里面,查找另一个字符串。

char *strstr(
  const char* str,
  const char* substr
);

它接受两个参数,第一个参数是源字符串,第二个参数是所要查找的子字符串。

如果匹配成功,就返回一个指针,指向源字符串里面的子字符串。如果匹配失败,就返回 NULL,表示无法找到子字符串:

char* str = "The quick brown fox jumped over the lazy dogs.";
char* p = strstr(str, "lazy");

printf("%s\n", p == NULL ? "null": p); // "lazy dogs."

上面示例中,strstr()用来在源字符串str里面,查找子字符串lazy。从返回的指针到字符串结尾,就是“lazy dogs.”。

strtok()用来将一个字符串按照指定的分隔符(delimiter),分解成一系列词元(tokens)。

char* strtok(char* str, const char* delim);

它接受两个参数,第一个参数是待拆分的字符串,第二个参数是指定的分隔符。

它返回一个指针,指向分解出来的第一个词元,并将词元结束之处的分隔符替换成字符串结尾标志\0。如果没有待分解的词元,它返回 NULL。

如果要遍历所有词元,就必须循环调用,参考下面的例子。

strtok()的第一个参数如果是 NULL,则表示从上一次strtok()分解结束的位置,继续往下分解。

#include <stdio.h>
#include <string.h>

int main(void) {
  char string[] = "This is a sentence with 7 tokens";
  char* tokenPtr = strtok(string, " ");

  while (tokenPtr != NULL) {
    printf("%s\n", tokenPtr);
    tokenPtr = strtok(NULL, " ");
  }
}

上面示例将源字符串按空格分解词元,它的输出结果如下:

This
is
a
sentence
with
7
tokens

注意strtok()会修改原始字符串,将所有分隔符都替换成字符串结尾符号\0

因此,最好生成一个原始字符串的拷贝,然后再对这个拷贝执行strtok()

strcoll()用于比较两个启用了本地化设置的字符串,用法基本与strcmp()相同:

int strcoll(const char *s1, const char *s2);

请看下面的示例。

setlocale(LC_ALL, "");

// 报告 é > f
printf("%d\n", strcmp("é", "f"));  

// 报告 é < f
printf("%d\n", strcoll("é", "f"));

上面示例比较带重音符号的éfstrcmp()会返回é大于f,而strcoll()就会正确识别é排在f前面,所以小于f

注意在比较之前,需要使用setlocale(LC_ALL, ""),启用本地化设置。

strxfrm()将一个本地化字符串转成可以使用strcmp()进行比较的形式,相当于strcoll()内部的第一部分操作:

size_t strxfrm(
  char * restrict s1, 
  const char * restrict s2, 
  size_t n
);

它接受三个参数,将第二个参数s2转为可以使用strcmp()比较的形式,并将结果存入第一个参数s1,第三个参数n用来限定写入的字符数,防止超出s1的边界。

它返回转换后的字符串长度,不包括结尾的终止符。

如果第一个参数是 NULL,第三个参数是0,则不进行实际的转换,只返回转换后所需的字符串长度。

下面的示例是用这个函数自己实现一个strcoll()

int my_strcoll(char* s1, char* s2) {
  int len1 = strxfrm(NULL, s1, 0) + 1;
  int len2 = strxfrm(NULL, s2, 0) + 1;

  char *d1 = malloc(len1);
  char *d2 = malloc(len2);

  strxfrm(d1, s1, len1);
  strxfrm(d2, s2, len2);

  int result = strcmp(d1, d2);

  free(d2);
  free(d1);

  return result;
}

上面示例中,先为两个进行比较的本地化字符串,分配转换后的存储空间,使用strxfrm()将它们转为可比较的形式,再用strcmp()进行比较。

strerror()函数返回特定错误的说明字符串:

char *strerror(int errornum);

它的参数是错误的编号,由errno.h定义,返回值是一个指向说明字符串的指针:

// 输出 No such file or directory
printf("%s\n", strerror(2));

上面示例输出2号错误的说明字符“No such file or directory“。

下面的例子是自定义报错信息:

#include <stdio.h>
#include <string.h>
#include <errno.h>

int main(void) {
  FILE* fp = fopen("NONEXISTENT_FILE.TXT", "r");

  if (fp == NULL) {
    char* errmsg = strerror(errno);
    printf("Error %d opening file: %s\n", errno, errmsg);
  }
}

上面示例中,通过strerror(errno)拿到当前的默认报错信息,其中errnoerrno.h定义的宏,表示当前的报错编号。然后,再输出一条自定义的报错信息。

以下内存操作函数,详见C语言内存管理

  • memcpy():内存复制函数。
  • memmove():内存复制函数(允许重叠)。
  • memcmp():比较两个内存区域。

memchr()用于在内存区域中查找指定字符:

void* memchr(const void* s, int c, size_t n);

它接受三个参数,第一个参数是内存区域的指针,第二个参数是所要查找的字符,第三个参数是内存区域的字节长度。

一旦找到,它就会停止查找,并返回指向该位置的指针。如果直到检查完指定的字节数,依然没有发现指定字符,则返回 NULL。

下面是一个例子:

char *str = "Hello, world!";
char *p;

p = memchr(str, '!', 13); // p 指向感叹号的位置

memset()将一段内存全部格式化为指定值:

void* memset(void* s, int c, size_t n);

它的第一个参数是一个指针,指向内存区域的开始位置,第二个参数是待写入的字符值,第三个参数是一个整数,表示需要格式化的字节数。它返回第一个参数(指针):

memset(p, ' ', N);

上面示例中,p 是一个指针,指向一个长度为 N 个字节的内存区域。memset()将该块内存区域的每个字节,都改写为空格字符。

下面是另一个例子:

char string1[15] = "BBBBBBBBBBBBBB";

// 输出 bbbbbbbBBBBBBB
printf("%s\n", (char*) memset(string1, 'b', 7));

memset()的一个重要用途,就是将数组成员全部初始化为0:

memset(arr, 0, sizeof(arr));

下面是将 Struct 结构都初始化为0的例子:

struct banana {
  float ripeness;
  char *peel_color;
  int grams;
};

struct banana b;

memset(&b, 0, sizeof b);

b.ripeness == 0.0;     // True
b.peel_color == NULL;  // True
b.grams == 0;          // True

上面示例,将 Struct banana 的实例 b 的所有属性都初始化为0:

void* memset(void* a, int c, size_t n);

size_t strlen(const char* s);

15.time

time_t 是一个表示时间的类型别名,可以视为国际标准时 UTC。它可能是浮点数,也可能是整数,Unix 系统一般是整数。

许多系统上,time_t 表示自时间纪元(time epoch)以来的秒数。Unix 的时间纪元是国际标准时 UTC 的1970年1月1日的零分零秒。time_t 如果为负数,则表示时间纪元之前的时间。

time_t 一般是32位或64位整数类型的别名,具体类型取决于当前系统。如果是32位带符号整数,time_t 可以表示的时间到 2038年1月19日03:14:07 UTC 为止;

如果是32位无符号整数,则表示到2106年。如果是64位带符号整数,可以表示-2930亿年到+2930亿年的时间范围。

struct tm 是一个数据结构,用来保存时间的各个组成部分,比如小时、分钟、秒、日、月、年等。下面是它的结构:

struct tm {
  int tm_sec;    // 秒数 [0, 60]
  int tm_min;    // 分钟 [0, 59]
  int tm_hour;   // 小时 [0, 23]
  int tm_mday;   // 月份的天数 [1, 31]
  int tm_mon;    // 月份 [0, 11],一月用 0 表示
  int tm_year;   // 距离 1900 的年数
  int tm_wday;   // 星期几 [0, 6],星期天用 0 表示
  int tm_yday;   // 距离1月1日的天数 [0, 365]
  int tm_isdst;  // 是否采用夏令时,1 表示采用,0 表示未采用
};

time()函数返回从时间纪元到现在经过的秒数:

time_t time(time_t* returned_value);

time()接受一个 time_t 指针作为参数,返回值会写入指针地址。参数可以是空指针 NULL。

time()的返回值是 time_t 类型的当前时间。 如果计算机无法提供当前的秒数,或者返回值太大,无法用time_t类型表示,time()函数就返回-1

time_t now;

// 写法一    
now = time(NULL);

// 写法二    
time(&now);

上面示例展示了将当前时间存入变量now的两种写法。

如果要知道某个操作耗费的精确时间,需要调用两次time(),再将两次的返回值相减:

time_t begin = time(NULL);

// ... 执行某些操作

time_t end = time(NULL);

printf("%d\n", end - begin);

注意,上面的方法只能精确到秒。

ctime()用来将 time_t 类型的值直接输出为人类可读的格式:

char* ctime( time_t const * time_value );

ctime()的参数是一个 time_t 指针,返回一个字符串指针。该字符串的格式类似“Sun Jul 4 04:02:48 1976\n\0”,尾部包含换行符和字符串终止标志。

下面是一个例子:

time_t now; 

now = time(NULL);

// 输出 Sun Feb 28 18:47:25 2021
printf("%s", ctime(&now));

注意,ctime()会在字符串尾部自动添加换行符。

localtime()函数用来将 time_t 类型的时间,转换为当前时区的 struct tm 结构。

gmtime()函数用来将 time_t 类型的时间,转换为 UTC 时间的 struct tm 结构。

它们的区别就是返回值,前者是本地时间,后者是 UTC 时间:

struct tm* localtime(const time_t* timer);
struct tm* gmtime(const time_t* timer);

下面是一个例子:

time_t now = time(NULL);

// 输出 Local: Sun Feb 28 20:15:27 2021
printf("Local: %s", asctime(localtime(&now)));

// 输出 UTC  : Mon Mar  1 04:15:27 2021
printf("UTC  : %s", asctime(gmtime(&now)));

asctime()函数用来将 struct tm 结构,直接输出为人类可读的格式,该函数会自动在输出的尾部添加换行符。

mktime()函数用于把一个 struct tm 结构转换为 time_t 值:

time_t mktime(struct tm* tm_ptr);

mktime()的参数是一个 struct tm 指针。

mktime()会自动设置 struct tm 结构里面的tm_wday属性和tm_yday属性,开发者自己不必填写这两个属性。所以,这个函数常用来获得指定时间是星期几(tm_wday)。

struct tm 结构的tm_isdst属性也可以设为-1,让mktime()决定是否应该采用夏令时。

下面是一个例子:

struct tm some_time = {
  .tm_year=82,   // 距离 1900 的年数
  .tm_mon=3,     // 月份 [0, 11]
  .tm_mday=12,   // 天数 [1, 31]
  .tm_hour=12,   // 小时 [0, 23]
  .tm_min=00,    // 分钟 [0, 59]
  .tm_sec=04,    // 秒数 [0, 60]
  .tm_isdst=-1,  // 夏令时
};
    
time_t some_time_epoch;
some_time_epoch = mktime(&some_time);
    
// 输出 Mon Apr 12 12:00:04 1982
printf("%s", ctime(&some_time_epoch));

// 输出 Is DST: 0
printf("Is DST: %d\n", some_time.tm_isdst);

difftime()用来计算两个时间之间的差异。Unix 系统上,直接相减两个 time_t 值,就可以得到相差的秒数,但是为了程序的可移植性,最好还是使用这个函数。

double difftime( time_t time1, time_t time2 );

difftime()函数接受两个 time_t 类型的时间作为参数,计算 time1 - time2 的差,并把结果转换为秒。

注意它的返回值是 double 类型:

#include <stdio.h>
#include <time.h>
    
int main(void) {
  struct tm time_a = {
    .tm_year=82, 
    .tm_mon=3,   
    .tm_mday=12, 
    .tm_hour=4,  
    .tm_min=00,  
    .tm_sec=04,  
    .tm_isdst=-1,
  };
    
  struct tm time_b = {
    .tm_year=120,
    .tm_mon=10,  
    .tm_mday=15, 
    .tm_hour=16, 
    .tm_min=27,  
    .tm_sec=00,  
    .tm_isdst=-1,
  };
    
  time_t cal_a = mktime(&time_a);
  time_t cal_b = mktime(&time_b);
    
  double diff = difftime(cal_b, cal_a);
    
  double years = diff / 60 / 60 / 24 / 365.2425;
  
  // 输出 1217996816.000000 seconds (38.596783 years) between events
  printf("%f seconds (%f years) between events\n", diff, years);
}

上面示例中,折算年份时,为了尽量准确,使用了一年的准确长度 365.2425 天,这样可以抵消闰年的影响。

strftime()函数用来将 struct tm 结构转换为一个指定格式的字符串,并复制到指定地址。

size_t strftime(
  char* str, 
  size_t maxsize, 
  const char* format, 
  const struct tm* timeptr
)

strftime()接受四个参数。

  • 第一个参数:目标字符串的指针。
  • 第二个参数:目标字符串可以接受的最大长度。
  • 第三个参数:格式字符串。
  • 第四个参数:struct tm 结构。

如果执行成功(转换并复制),strftime()函数返回复制的字符串长度;如果执行失败,返回-1

下面是一个例子:

#include <stdio.h>
#include <time.h>

int main(void) {
  char s[128];
  time_t now = time(NULL);

  // %c: 本地时间
  strftime(s, sizeof s, "%c", localtime(&now));
  puts(s);   // Sun Feb 28 22:29:00 2021

  // %A: 完整的星期日期的名称
  // %B: 完整的月份名称
  // %d: 月份的天数
  strftime(s, sizeof s, "%A, %B %d", localtime(&now));
  puts(s);   // Sunday, February 28

  // %I: 小时(12小时制)
  // %M: 分钟
  // %S: 秒数
  // %p: AM 或 PM
  strftime(s, sizeof s, "It's %I:%M:%S %p", localtime(&now));
  puts(s);   // It's 10:29:00 PM

  // %F: ISO 8601 yyyy-mm-dd 格式
  // %T: ISO 8601 hh:mm:ss 格式
  // %z: ISO 8601 时区
  strftime(s, sizeof s, "ISO 8601: %FT%T%z", localtime(&now));
  puts(s);   // ISO 8601: 2021-02-28T22:29:00-0800
}

下面是常用的格式占位符。

  • %%:输出 % 字符。
  • %a:星期几的简写形式,以当地时间计算。
  • %A:星期几的完整形式,以当地时间计算。
  • %b:月份的简写形式,以当地时间计算。
  • %B:月份的完整形式,以当地时间计算。
  • %c:日期和时间,使用“%x %X”。
  • %d:月份的天数(01-31)。
  • %H:小时,采用24小时制(00-23)。
  • %I:小时,采用12小时制(00-12)。
  • %J:一年的第几天(001-366)。
  • %m:月数(01-12)。
  • %M:分钟(00~59)。
  • %P:AM 或 PM。
  • %R:相当于"%H:%M"。
  • %S:秒(00-61)。
  • %U:一年的第几星期(00-53),以星期日为第1天。
  • %w:一星期的第几天,星期日为第0天。
  • %W:一年的第几星期(00-53),以星期一为第1天。
  • %x:完整的年月日的日期,以当地时间计算。
  • %X:完整的时分秒的时间,以当地时间计算。
  • %y:两位数年份(00-99)。
  • %Y:四位数年份(例如 1984)。
  • %Z:时区的简写。

timespec_get()用来将当前时间转成距离时间纪元的纳秒数(十亿分之一秒)。

int timespec_get ( struct timespec* ts, int base ) ;

timespec_get()接受两个参数。

第一个参数是 struct timespec 结构指针,用来保存转换后的时间信息。struct timespec 的结构如下。

struct timespec {
  time_t tv_sec;   // 秒数
  long   tv_nsec;  // 纳秒
};

第二个参数是一个整数,表示时间计算的起点。标准只给出了宏 TIME_UTC 这一个可能的值,表示返回距离时间纪元的秒数。

下面是一个例子:

struct timespec ts;
    
timespec_get(&ts, TIME_UTC);
    
// 1614581530 s, 806325800 ns
printf("%ld s, %ld ns\n", ts.tv_sec, ts.tv_nsec);
    
double float_time = ts.tv_sec + ts.tv_nsec/1000000000.0;

// 1614581530.806326 seconds since epoch
printf("%f seconds since epoch\n", float_time);

clock()函数返回从程序开始执行到当前的 CPU 时钟周期。一个时钟周期等于 CPU 频率的倒数,比如 CPU 的频率如果是 1G Hz,表示1秒内时钟信号可以变化 10^9 次,那么每个时钟周期就是 10^-9 秒:

clock_t clock(void);

clock()函数返回一个数字,表示从程序开始到现在的 CPU 时钟周期的次数。这个值的类型是 clock_t,一般是 long int 类型。

为了把这个值转换为秒,应该把它除以常量CLOCKS_PER_SEC(每秒的时钟周期),这个常量也由time.h定义。

printf("CPU time: %f\n", clock() / (double)CLOCKS_PER_SEC);

上面示例可以输出程序从开始到运行到这一行所花费的秒数。

如果计算机无法提供 CPU 时间,或者返回值太大,无法用clock_t类型表示,clock()函数就返回-1

为了知道某个操作所耗费的精确时间,需要调用两次clock(),然后将两次的返回值相减:

clock_t start = clock();

// ... 执行某些操作

clock_t end = clock();

long double seconds = (float)(end - start) / CLOCKS_PER_SEC;

16.wchar

宽字符使用两个或四个字节表示一个字符,导致 C 语言常规的字符处理函数都会失效。wchar.h 定义了许多宽字符专用的处理函数。

wchar.h 定义了一个类型别名 wint_t,表示宽字符对应整数值。

wchar.h 还定义了一个宏 WEOF,表示文件结束字符 EOF 的宽字符版。

btowc()将单字节字符转换为宽字符,wctob()将宽字符转换为单字节字符。

wint_t btowc(int c);
int wctob(wint_t c);

btowc()返回一个宽字符。如果参数是 EOF,或转换失败,则返回 WEOF。

wctob()返回一个单字节字符。如果参数是 WEOF,或者参数宽字符无法对应单个的单字节字符,则返回 EOF。

下面是用法示例:

wint_t wc = btowc('B'); 

// 输出宽字符 B
wprintf(L"Wide character: %lc\n", wc);

unsigned char c = wctob(wc);

// 输出单字节字符 B
wprintf(L"Single-byte character: %c\n", c);

fwide()用来设置一个字节流是宽字符流,还是多字节字符流。

如果使用宽字符专用函数处理字节流,就会默认设置字节流为宽字符流,否则就需要使用fwide()显式设置。

int fwide(FILE* stream, int mode);

它接受两个参数,第一个参数是文件指针,第二个参数是字节流模式,有三种选择。

  • 0:字节流模式保持原样。
  • -1(或其他负值):设为多字节字符流。
  • 1(或其他正值):设为宽字符流。

fwide()的返回值也分成三种情况:如果是宽字符流,返回一个正值;如果是多字节字符流,返回一个负值;如果是普通字符流,返回0

一旦设置了字节流模式,就无法再更改:

#include <stdio.h>
#include <wchar.h>

int main(void) {
  wprintf(L"Hello world!\n");
  int mode = fwide(stdout, 0);
  wprintf(L"Stream is %ls-oriented\n", mode < 0 ? L"byte" : L"wide");
}

上面示例中,wprintf()将字节流隐式设为宽字符模式,所以fwide(stdout, 0)的返回值大于零。

下面这些函数基本都是 stdio.h 里面的字符处理函数的宽字符版本,必须使用这些函数来操作宽字符。

  • fgetwc() 从宽字符流中获取宽字符,对应 fgetc()。
  • fgetws() 从宽字符流中读取宽字符串,对应 fgets()。
  • fputwc() 将宽字符写入宽字符流,对应 fputc()。
  • fputws() 将宽字符串写入宽字符流,对应 fputs()。
  • fwprintf() 格式化宽输出到宽字符流,对应 fprintf()。
  • fwscanf() 来自宽字符流的格式化宽字符输入,对应 fscanf()。
  • getwchar() 从 stdin 获取一个宽字符,对应 getchar()。
  • getwc() 从 stdin 获取一个宽字符,对应 getc()。
  • putwchar() 写一个宽字符到 stdout,对应 putchar()。
  • putwc() 写一个宽字符到 stdout,对应 putc()。
  • swprintf() 格式化宽输出到宽字符串,对应 sprintf()。
  • swscanf() 来自宽字符串的格式化宽输入,对应 sscanf()。
  • ungetwc() 将宽字符推回输入流,对应 ungetc()。
  • vfwprintf() 可变参数的格式化宽字符输出到宽字符流,对应 vfprintf()。
  • vfwscanf() 来自宽字符流的可变参数格式化宽字符输入,对应 vfscanf()。
  • vswprintf() 可变参数的格式化宽字符输出到宽字符串,对应 vswprintf()。
  • vswscanf() 来自宽字符串的可变参数格式化宽字符输入,对应 vsscanf()。
  • vwprintf() 可变参数格式化宽字符输出,对应 vprintf()。
  • vwscanf() 可变参数的格式化宽字符输入,对应 vscanf()。
  • wcscat() 危险地连接宽字符串,对应 strcat()。
  • wcschr() 在宽字符串中查找宽字符,对应 strchr()。
  • wcscmp() 比较宽字符串,对应 strcmp()。
  • wcscoll() 比较两个考虑语言环境的宽字符串,对应 strcoll()。
  • wcscpy() 危险地复制宽字符串,对应 strcpy()。
  • wcscspn() 不是从宽字符串前面开始计算字符,对应 strcspn()。
  • wcsftime() 格式化的日期和时间输出,对应 strftime()。
  • wcslen() 返回宽字符串的长度,对应 strlen()。
  • wcsncat() 更安全地连接宽字符串,对应 strncat()。
  • wcsncmp() 比较宽字符串,长度有限,对应 strncmp()。
  • wcsncpy() 更安全地复制宽字符串,对应 strncpy()。
  • wcspbrk() 在宽字符串中搜索一组宽字符中的一个,对应 strpbrk()。
  • wcsrchr() 从末尾开始在宽字符串中查找宽字符,对应 strrchr()。
  • wcsspn() 从宽字符串前面的集合中计算字符,对应 strspn()。
  • wcsstr() 在另一个宽字符串中找到一个宽字符串,对应 strstr()。
  • wcstod() 将宽字符串转换为 double,对应 strtod()。
  • wcstof() 将宽字符串转换为 float,对应 strtof()。
  • wcstok() 标记一个宽字符串,对应 strtok()。
  • wcstold() 将宽字符串转换为 long double,对应 strtold()。
  • wcstoll() 将宽字符串转换为 long long,对应 strtoll()。
  • wcstol() 将宽字符串转换为 long,对应 strtol()。
  • wcstoull() 将宽字符串转换为 unsigned long long,对应 strtoull()。
  • wcstoul() 将宽字符串转换为 unsigned long,对应 strtoul()。
  • wcsxfrm() 转换宽字符串以根据语言环境进行比较,对应 strxfrm()。
  • wmemcmp() 比较内存中的宽字符,对应 memcmp()。
  • wmemcpy() 复制宽字符内存,对应 memcpy()。
  • wmemmove() 复制宽字符内存,可能重叠,对应 memmove()。
  • wprintf() 格式化宽输出,对应 printf()。
  • wscanf() 格式化宽输入,对应 scanf()。

wchar.h 也定义了一些多字节字符的专用函数。

  • mbsinit() 判断 mbstate_t 是否处于初始转换状态。
  • mbrlen() 给定转换状态时,计算多字节字符串的字节数,对应 mblen()。
  • mbrtowc() 给定转换状态时,将多字节字符转换为宽字符,对应 mbtowc()。
  • wctombr() 给定转换状态时,将宽字符转换为多字节字符,对应 wctomb()。
  • mbsrtowcs() 给定转换状态时,将多字节字符串转换为宽字符串,对应 mbstowcs()。
  • wcsrtombs() 给定转换状态时,将宽字符串转换为多字节字符串,对应 wcstombs()。

17.wctype

wctype.h 提供 ctype.h 里面函数的宽字符版本。

下面函数判断宽字符的类型。

  • iswalnum() 测试宽字符是否为字母数字
  • iswalpha() 测试宽字符是否为字母
  • iswblank() 测试这是否是一个宽空白字符
  • iswcntrl() 测试这是否是一个宽控制字符。
  • iswdigit() 测试这个宽字符是否是数字
  • iswgraph() 测试宽字符是否是可打印的非空格字符
  • iswlower() 测试宽字符是否为小写
  • iswprint() 测试宽字符是否可打印
  • iswpunct() 测试宽字符是否为标点符号
  • iswspace() 测试宽字符是否为空格
  • iswupper() 测试宽字符是否为大写
  • iswxdigit() 测试宽字符是否为十六进制数字

iswctype()是上一节各种宽字符类型判断函数的通用版本,必须与wctype()配合使用。

int iswctype(wint_t wc, wctype_t desc);

iswctype()接受两个参数,第一个参数是一个需要判断类型的宽字符,第二个参数是宽字符类型描述,来自wctype()的返回值。

如果宽字符属于指定类型,iswctype()返回一个非零值,否则返回零。

wctype()用来获取某个种类宽字符的类型描述。

wctype_t wctype(const char* property);

wctype()的参数是一个给定的字符串,可用的值如下:alnum、alpha、blank、cntrl、digit、graph、lower、print、punct、space、upper、xdigit。

wctype()的返回值的类型为 wctype_t,通常是一个整数。如果参数是一个无效值,则返回0

if (iswctype(c, wctype("digit")))
// 相当于
if (iswdigit(c))

上面示例用来判断宽字符c是否为数值,相当于iswdigit()

iswctype()的完整类型判断如下。

iswctype(c, wctype("alnum"))	// 相当于 iswalnum(c)
iswctype(c, wctype("alpha"))	// 相当于 iswalpha(c)
iswctype(c, wctype("blank"))	// 相当于 iswblank(c)
iswctype(c, wctype("cntrl"))	// 相当于 iswcntrl(c)
iswctype(c, wctype("digit"))	// 相当于 iswdigit(c)
iswctype(c, wctype("graph"))	// 相当于 iswgraph(c)
iswctype(c, wctype("lower"))	// 相当于 iswlower(c)
iswctype(c, wctype("print"))	// 相当于 iswprint(c)
iswctype(c, wctype("punct"))	// 相当于 iswpunct(c)
iswctype(c, wctype("space"))	// 相当于 iswspace(c)
iswctype(c, wctype("upper"))	// 相当于 iswupper(c)
iswctype(c, wctype("xdigit"))	// 相当于 iswxdigit(c)

wctype.h 提供以下宽字符大小写转换函数。

  • towlower() 将大写宽字符转换为小写
  • towupper() 将小写宽字符转换为大写
  • towctrans() 宽字符大小写转换的通用函数
  • wctrans() 大小写转换的辅助函数,配合 towctrans() 使用

先看towlower()towupper()的用法示例。

towlower(L'B') // b
towupper(L'e') // E

towctrans()wctrans()的原型如下。

wint_t towctrans(wint_t wc, wctrans_t desc);
wctrans_t wctrans(const char* property);

下面是它们的用法示例。

towctrans(c, wctrans("toupper"))	// 相当于 towupper(c)
towctrans(c, wctrans("tolower"))	// 相当于 towlower(c)
作者:余识
全部文章:0
会员文章:0
总阅读量:0
c/c++pythonrustJavaScriptwindowslinux