1.流和FILE对象
- 对于标准I/O库,他们的操作是围绕流进行的。
- 当用标准IO库打开或创建一个文件时,我们已使一个流与一个文件相关联
- 与标准I/O不同,非标准I/O不使用文件流来读取和写入文件,而是直接操作文件的文件描述符(file descriptor) 。
非标准I/O通常提供以下函数或接口进行文件操作:
·open: 用于打开文件,返回文件描述符。
·read:从文件中读取数据。
·write: 将数据写入文件。
·lseek:设置文件的读写位置。
·close: 关闭文件。
标准IO vs. 文件IO(系统调用)
| 特性 | 标准IO | 文件IO(系统调用) |
|---|---|---|
| 接口级别 | 高级,封装了系统调用 | 低级,直接调用内核 |
| 操作对象 | FILE *(流指针) | 文件描述符(整数,如0, 1, 2, 3...) |
| 缓冲 | 自动管理,有三种模式 | 无缓冲,或需要用户自己管理缓冲区 |
| 可移植性 | 高,符合C标准 | 低,不同Unix系统可能有细微差别 |
| 性能 | 通常更高,因为缓冲减少了系统调用次数 | 每次调用都是系统调用,上下文切换开销大 |
| 控制力 | 相对较弱,抽象程度高 | 极强,可以直接控制设备等 |
2.缓冲
(1)标准I/O库提供缓冲的目的是尽可能减少使用read和write调用的次数
04-Linux系统编程-第01天(文件IO、阻塞非阻塞) - hh9515 - 博客园
Linux系统编程 42 -系统调用和库函数的比较--预读入缓输出-CSDN博客
- read、 write 函数常常被称为 Unbuffered I/O。 指的是无用户级缓冲区。 但不保证不使用内核缓冲区。
(2)标准IO提供了三种类型的缓冲
- 标准I/O缓冲区通常位于运行内存(RAM)中。C标准库使用内存来分配和管理缓冲区。
- 具体来说,当你打开一个文件流(通过fopen 函数)时,C标准库会为该文件流分配一个缓冲区,并将该缓冲区与文件流相关联。这个缓冲区通常是使用操作系统提供的内存管理函数(如mallo)来动态分配的。操作系统提供了内存分配和释放的机制,C标准库则利用这些机制来为文件流分配所需的内存空间。
- 文件流的缓冲区大小可以通过函数setvbuf来设置,你可以指定缓冲区的大小或选择使用标准库提供的默认大小。
- 虽然标准I/O缓冲区位于运行内存中,但它在实际应用中并不直接与物理文件进行读写。相反,标准库将缓冲区作为中间存储区域,当缓冲区被填满或满足一定条件时,数据将从缓冲区复制到操作系统的文件缓存区中,最终才会写入到物理文件中。
(3)标准IO提供了三种类型的缓冲
- 全缓冲:在这种情况下,当填满标准I/O缓存后才进行实际I/O操作。全缓冲的典型代表是对磁盘文件的读写。
- 行缓冲:当在输入和输出中遇到换行符时,执行真正的I/O操作。这时,我们输入的字符先存放在缓冲区,等按下回车键换行时才进行实际的I/O操作。典型代表是键盘输入数据。
- 不带缓冲:也就是不进行缓冲,标准出错情况stderr是典型代表,这使得出错信息可以直接尽快地显示出来。
3.打开流
- fopen:FILE *fopen(const char *filename, const char *mode);
- fdopen:用于将一个已存在的文件描述符(file descriptor)转换为一个对应的文件流(FILE *)。
4.读和写流
(1)每次读一个字符的IO:getc 或 fgetc
如果流是带缓冲的,可以使用 getc 或 fgetc 函数进行每次一个字符的 I/O 操作。带缓冲的流意味着数据会先被读取到缓冲区,然后一次性操作缓冲区中的数据,可以提高 I/O 的效率。
- 如果没有禁用流缓冲,默认会使用缓冲区的数据,每次调用 fgetc 都会从缓冲区中获取一个字符。
- 当缓冲区被耗尽时,会自动从文件中读取更多的数据进行填充。
- 当缓冲区被耗尽时,文件流会自动从文件中读取更多的数据来填充缓冲区。这样可以避免每次都直接与文件进行 I/O 操作,以提高 I/O 的效率。
- 默认情况下,标准I/O库会负责管理文件流的缓冲区,确保适当的数据量被从文件中读取到缓冲区中。当程序使用 fgetc 函数等来读取数据时,如果缓冲区中的数据已经被耗尽,标准I/O库会自动将更多数据从文件中读取到缓冲区。
#include <stdio.h> int main() { FILE *file = fopen("example.txt", "r"); if (file == NULL) { perror("文件打开失败"); return -1; } int ch; // 使用 fgetc 逐个字符读取 while ((ch = fgetc(file)) != EOF) { putchar(ch); } fclose(file); return 0; }
(2)每次一行IO:fgets
- fgets 函数会从文件流 stream 中读取字符,直到达到指定的最大长度 n-1 或者读取到换行符为止(包括换行符),然后将读取的字符串存储到 buffer 中,并在末尾添加 null 字符来表示字符串的结束。
6.二进制IO
- fread:用于从文件读取二进制数据
- fread:用于从文件读取二进制数据
如何使用二进制 I/O 进行文件读取和写入:
#include <stdio.h> #include <string.h> typedef struct { int id; char name[50]; float score; } Student; // 写入结构体数组到文件 int write_students_to_file(const char *filename) { Student students[] = { {1, "张三", 85.5}, {2, "李四", 92.0}, {3, "王五", 78.5} }; FILE *file = fopen(filename, "wb"); if (!file) { perror("文件打开失败"); return -1; } // 写入整个数组 size_t written = fwrite(students, sizeof(Student), 3, file); printf("成功写入 %zu 个结构体\n", written); fclose(file); return 0; } // 从文件读取结构体数组 int read_students_from_file(const char *filename) { FILE *file = fopen(filename, "rb"); if (!file) { perror("文件打开失败"); return -1; } Student students[3]; size_t read = fread(students, sizeof(Student), 3, file); printf("成功读取 %zu 个结构体\n", read); for (int i = 0; i < read; i++) { printf("学生 %d: ID=%d, 姓名=%s, 分数=%.1f\n", i+1, students[i].id, students[i].name, students[i].score); } fclose(file); return 0; }
二进制 vs 文本 I/O 对比
| 特性 | 二进制 I/O | 文本 I/O |
|---|---|---|
| 数据表示 | 原始字节 | 字符编码 |
| 换行符处理 | 不转换 | 系统相关转换 |
| 适用场景 | 结构体、图片、音频等 | 文本文件 |
| 文件大小 | 精确控制 | 可能因编码而变化 |
| 可读性 | 不可直接阅读 | 可直接阅读 |
二进制IO的问题:
数据类型大小不一致
填充和对齐问题
- 平台兼容性问题(字节序)
暂时记录到这里 2025年12月17日17:17:41