零、写在前面

IO（读入/输出）优化是很实用&简单的常数优化 ~（卡常技巧）~ 。C++为了兼容性导致cin、cout慢过天际，对于大量数据的读入和输出往往不堪重负。这个时候使用读入优化、输出优化可以节省数倍的时间。

很多人说Pascal读入快。其实Pascal的读入只比普通cin快（ ~这点确实是碾压~ ），在很多时候并不如scanf和关闭流同步的cin。

本文旨在介绍与操作系统无关的~我会的~C++的IO优化，因此Linux平台下的mmap优化不作讨论。

本文中所有读入优化、输出优化只适用于整数。由于实数读入优化/输出优化适用范围不广、效率不高，本文不作讨论。但如果你读完并理解本文，是可以写出好的实数读入优化/输出优化来的。只需要在原来的基础上处理小数点即可，留给读者自行思考。

本文中所有的代码均在 Linux、Windows 上通过编译和测试。如果你的程序无法通过编译，可能是你把本文各部分拼凑起来导致重名了。

本文中所有的读优、输优均指 读入优化 、 输出优化。（虽然通常被称为快读、快写）

一、基本读入优化

先不解释，上代码。给出最简单的读入优化：

inline int redn(){
    int ret=0,f=1;char ch=getchar();
    while (ch<'0'||ch>'9') {if (ch=='-') f=-f;ch=getchar();}
    while (ch>='0'&&ch<='9') ret=ret*10+ch-'0',ch=getchar();
    return ret*f;
}

也可以这样写方便重载：

inline int redn(int& ret){
    ret=0,f=1;char ch=getchar();
    while (ch<'0'||ch>'9') {if (ch=='-') f=-f;ch=getchar();}
    while (ch>='0'&&ch<='9') ret=ret*10+ch-'0',ch=getchar();
    ret*=f;
}

当然也可以传指针进去······反正差不多，再写就没意思了。

优化核心在于getchar的速度很快。（头文件<cstdio>）

原理我想大家应该都懂吧。先一直读入字符直到出现数字，再一直读入数字同时累乘直到读入的不是数字。可以用isdigit写。当然一般情况下只需要isspace就够了，而且后者要更快一点。有需要可以自行修改。（头文件<cctype>）

有人说可以用位运算累乘。但是你如果懂一点汇编就知道这是没有区别的。

二、对于不定参数的读优重载

也可以叫可变参数、可变长参数。

需要 C++ 11 支持

怎么看是否支持C++ 11？包括luogu、codeforce等各大OJ都是支持的。本机支持不支持编译一下能通过就是支持。说到codeforce，据说在它上面cin比scanf快？

能不能提速这个不好说啊······反正用起来更方便是真的。

先上代码：

#include<bits/stdc++.h>
using namespace std;
#define ri register int
template <typename T>inline void redi(T& t){
    ri c=getchar();t=0;
    while(!isdigit(c))c=getchar();
    while(isdigit(c))t=t*10+c-48,c=getchar();
}
template <typename T,typename... Args> inline void redi(T& t, Args&... args){
    redi(t);redi(args...);
}
int main (int argc,char const * argv[]){
    int a,b,c,d;
    redi(a,b,c,d);
    cout<<a+b+c+d<<endl;
    return 0;
}

用来读无符号整数，要读负数的话稍微改一下第一个函数就好（见【基本读入优化】）。

首先你要知道什么是template。

代码中template <typename T>前缀表示一个类型。换句话说，你传入的t是int类型变量，T就表示int；如果传入的t是long long类型的，T就是long long。

第二个函数是第一个函数的重载。主要是typename... Args的问题吧。这个表示不定参。就是不确定有多少个参数。

可能讲的不是很清楚，但你自己用GDB跑一遍肯定就完全理解了。

或者去微软的MSDN上看看：点击传送

还有一个用var_list的版本，但没这个简单，有兴趣的可以自己了解一下（比如可以去看看printf函数的定义）。这里就不作讨论了。

三、基于fread的读入优化

考虑到getchar的速度还是不够快，我们可以使用fread（头文件<cstdio>）来优化getchar，代码如下：

#define getchar()(p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++)
char buf[1<<21],*p1=buf,*p2=buf;

然后可以直接使用前文所述的读优。

打成三目运算符可能不太好理解哈。

关于逗号“,”，不理解的话看这个例子：return 1,2,3,4最终返回的是4，也就是最后一个。还需要注意，&&是“短路运算符”，一旦当前值为假就不会继续往后执行，直接返回。

所以这句话的意思是：设置头指针p1和尾指针p2，fread一次读入1<<21个字符存在buf里，然后用p1来调用；当p1撞到p2时再次用fread读入1<<21个字符······

因此优化原理就是让fread一次性读入大量数据，再让getchar直接调用内存，如果刚开始读的不够多那就再调用fread读入数据，直到文件的末尾。要注意fread是很快的。

后文中的输优也差不多是这样的。

fread函数的用法很简单，这里不再赘述了。百度搜索关键词：fread、fread返回值、fread的用法。

当然过多的宏定义很危险，所以也可以直接这样写成函数：

char buf[1<<21],*p1=buf,*p2=buf;
inline int getc(){
    return p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++;
}
inline int redi(){
    int ret = 0,f = 0;char ch = getc();
    while (!isdigit (ch)){
        if (ch == '-') f = 1;
        ch = getc();
    }
    while (isdigit (ch)){
        ret = ret * 10 + ch - 48;
        ch = getc();
    }
    return f?-ret:ret;
}

~其实差不多吧~

buf数组开大一点吧，太小的话读入不够快。

注意isdigit函数需要头文件cctype。

不定参数重载版本前面介绍过方法，就不写了。

注意

本机调试前请先检查你的电脑上的fread是否能读入数据！

检查代码：

#include <bits/stdc++.h>
using namespace std;
char buf[10];
int main(){
    fread(buf,1,sizeof(buf),stdin);
    cout<<ferror(stdin)<<endl;
    return 0;
}

随便输入一堆字，以回车+Ctrl+Z+回车结尾。如：123456+回车+Ctrl+Z+回车。

如果输出不是零，那么你的fread出问题了。

解决方法？我也不大清楚。

~换一台电脑就好了~

当然也可以用gdb调。

四、输出优化

说了这么多读入优化，那么输出优化呢？

按照刚才的思路，可以用putchar（头文件<cstdio>）来优化。然而单纯使用putchar来优化还没有printf快 。

不过还是给出输出优化的代码：

void wrtn(int x){
    if(x<0) {putchar('-');x=-x;}
    int y=10,len=1;
    while(y<=x) {y*=10;len++;}
    while(len--){y/=10;putchar(x/y+48);x%=y;}
}

既然不够快，给出有什么用？因为我们可以用fwrite（头文件<cstdio>）来优化putchar，这样就能比printf快了 ~滑稽~

代码如下：

#include <cstdio>

char buffer[1<<21];
int p1=-1;
const int p2=(1<<21)-1;

inline void flush(){
    fwrite(buffer, 1, p1+1, stdout),
        p1=-1;
}

inline void putc(const char &x){
    if (p1 == p2)flush();
    buffer[++p1]=x;
}

void wrtn(int x){
    static char buf[15];
    static int len=-1;
    if(x>=0){
        do{
            buf[++len]=x%10+48,x/=10;
        } while (x);
    }
    else{
        putc('-');
        do{
            buf[++len]=-(x%10)+48, x/=10;
        }while (x);
    }
    while(len >= 0)putc(buf[len]),--len;
}

int main(void){
    wrtn(12312);
    putc('\n');
    wrtn(-2147483648);
    flush();
    return 0;
}

递归实现有点慢，所以改了下。

好像while语句也可以优化一下，~懒得写了~ 留给读者思考。

就是把要输出的东西全部放起来，到一定量时再输出。

在上文的例子中是以\n分隔输出的。使用时要按需要改。

在程序结束之前一定要再调用一次flush函数

为什么？其实看懂这个函数的人应该都知道，print函数中只有putc调用flush时才有可能输出。

如果题目强制在线，在每个回答结束后都要调用flush。

平常的时候buf数组也是老规矩，稍微大点吧。

在使用以上代码进行调试或运行时，如果stdin没有重定向至文件，也就是在控制台进行输入时，需要在输出末尾加上回车+Ctrl+Z+回车结束输入（Windows操作系统下）。

五、基于streambuf的IO优化

如果你的电脑用不了fread的话这个好像也是不行的。

输入输出似乎已经不能再优化了。但是笔者在查询资料时发现了一种新的优化方法：使用iostream底层的streambuf进行优化。

（头文件当然是<iostream>）

原理还是用各种函数代替getchar、putchar，看完你就会发现和fread的版本没有本质上的区别，只不过这里是用streambuf类实现的。。。

为了方便区分还是把两个streambuf分别取名为inbuf和outbuf吧。

所以下文中的static std::streambuf *inbuf = cin.rdbuf();相当于获取cin的缓存地址。注意static表示这是静态变量。

几个函数稍微提一下：

函数sputc 用法类似putchar：

outbuf -> sputc(const char ch);

对，有sgetc函数的。

函数sgetn

类似fread:

inbuf -> sgetn(char* buf, MAX_INPUT);

本来要用类似fwrite的sputn的，但好像没有sputc快？

sputn就是一个一个调用sputc，而且sputn会先调用xsputn，再由xsputn调用sputc。

所以给出sputn格式，有兴趣的可以试一下：outbuf -> sputn(char* buf,max_output)

经过笔者的整理和封装后测试程序代码如下：

#include <iostream>
#include <cstdio>
#include <cctype>
using namespace std;
using std::cin;
using std::cout;
using std::endl;
namespace IN {
    const int MAX_INPUT = 1000000;
    #define getc() (p1 == p2 && (p2 = (p1 = buf) + inbuf -> sgetn(buf, MAX_INPUT), p1 == p2) ? EOF : *p1++)
    char buf[MAX_INPUT], *p1, *p2;
    template <typename T> inline bool redi(T &x) {
        static std::streambuf *inbuf = cin.rdbuf();
        x = 0;
        register int f = 0, flag = false;
        register char ch = getc();
        while (!isdigit(ch)) {
            if (ch == '-') f = 1;
        ch = getc();
        }
        if (isdigit(ch)) x = x * 10 + ch - '0', ch = getc(),flag = true;
        while (isdigit(ch)) {
            x = x * 10 + ch - 48;
            ch = getc();
        }
        x = f ? -x : x ;
        return flag;
    }
    template <typename T,typename ...Args> inline bool redi(T& a,Args& ...args) {
       return redi(a) && redi(args...);
    }
    #undef getc
}

namespace OUT {
    template <typename T> inline void put(T x) {
        static std::streambuf *outbuf = cout.rdbuf();
        static char stack[21];
        static int top = 0;
        if (x < 0) {
            outbuf -> sputc('-');
            x=-x;
        }
        if (!x) {
            outbuf -> sputc('0');
            outbuf -> sputc('\n');
            return;
        }
        while (x) {
            stack[++top] = x % 10 + '0';
            x /= 10;
        }
        while (top) {
            outbuf -> sputc(stack[top]);
            -- top;
        }
        outbuf -> sputc('\n');
    }
    inline void putc (const char ch) {
        static std::streambuf *outbuf = cout.rdbuf();
        outbuf -> sputc(ch);
    }
    template <typename T> inline void put(const char ch,T x) {
        static std::streambuf *outbuf = cout.rdbuf();
        static char stack[21];
        static int top = 0;
        if (x < 0) {
            outbuf -> sputc('-');
            x=-x;
        }
        if (!x) {
            outbuf -> sputc('0');
            outbuf -> sputc(ch);
            return;
        }
        while (x) {
            stack[++top] = x % 10 + '0';
            x /= 10;
        }
        while (top) {
            outbuf -> sputc(stack[top]);
            --top;
        }
        outbuf -> sputc(ch);
    }
    template<typename T,typename ...Args> inline void put(T a,Args ...args) {
        put(a);put(args...);
    }
    template<typename T,typename ...Args> inline void put(const char ch,T a,Args ...args) {
        put(ch,a);put(ch,args...);
    }
}
using IN::redi;
using OUT::put;
using OUT::putc;
int main(int argc, char const *argv[]){
    freopen("testdata.in","r",stdin);
    freopen("testdata.out","w",stdout);
    std::ios::sync_with_stdio(false);
    cin.tie(NULL);
    cout.tie(NULL);
    int a,b;
    redi(a,b);
    put(' ',a,b);
    putc('\n');
    put('\n',a,b,a+b,a*b);
    fclose(stdin);fclose(stdout);
    return 0;
}

输入文件：

2 3

输出文件：

同理，MAX_INPUT稍微大一点，空间不会爆的。

在控制台进行调试时不要忘了回车+Ctrl+Z+回车。

读优这种东西不懂的话GDB跑一遍嘛。。。

应该是比fread什么要快的。可能快的不明显，有些地方还可以再优化一下。

说明：

std::ios::sync_with_stdio(false);
cin.tie(NULL);
cout.tie(NULL);

这个都懂的吧，取消同步，取消绑定。用了之后快过scanf。但是不能再用cstdio了。

redi函数：

类似于scanf，只是不用加格式字符串。返回一个bool值，当且仅当所有数据读入成功时返回true，可以配合while使用。

putc函数：

用法同putchar。

put函数：

格式一：类似于printf，传入任意个变量，以\n分隔输出；

格式二：在格式一的基础上，传入一个常量字符，并以之为分隔输出。

getc：

看到定义和上文的fread优化的应该都懂了吧。优化过的getchar。可以写成函数。

六、注意事项

关于streambuf优化：

类型

以上函数仅支持int、long long、unsigned long long等整形变量 。除redi函数外其余函数均无返回值。

速度

如果追求速度，请去掉redi的返回值，并删掉重载过的函数。也就是只用第一个redi和第一个put。而且如果读入数据没有负数的话可以稍作修改。

注意函数的命名

我记得C++是有一个函数叫read的。之所以没出问题可能是因为没有用到那个库、那个命名空间，或者因为参数数量不同直接被重载了。~这就是为什么我的函数名···~

MAX_INPUT

MAX_INPUT尽量大一点。

其他：

再次提醒

使用std::ios::sync_with_stdio(false);之后不能用scanf等cstdio里的函数。

部分代码 需要C++ 11 。~换句话说，不确定NOIP能不能用。~

小数据

小数据（ $10^3$ 个字符以内）的读入用上面的优化都有可能变慢。这个时候还是用scanf吧。

兼容性

除了最简单的读优和输优以外，使用读优之后会导致scanf、printf、getchar等函数不能使用

luogu

有大佬说洛谷上计算程序的运行时间是看命令执行次数的，经过我自己的检验好像确实如此（检验方法：循环用register和不用做对比，多次测试取平均值）。不排除别的oj这样做的可能。那么这时候用任何的读优都有可能起反作用。但用cena、ccr之类的测评软件线下测评时是没有问题的。

七、IO优化的弊端

IO优化很实用，然而其并非没有缺点。

基于fread的读入优化、基于streambuf的读入优化都需要一个buf数组。这是比较占内存的（ ~如果你只开到5什么的话当我没说~ 。而且除了最基本的读优输优以外，本文介绍的所有函数都会导致不兼容其他IO函数（输优要好一点）。不光是cstdio，cout等函数都不行。遇到读入数据有字符串的情况下，还需要自己再写一个函数。

当然最基本的读优完全没有问题，几乎能代替scanf进行整数读入。但在字符和数字混用时使用可能会出错，因为它会“吃掉”一个不是数字的字符。

不过毫无疑问，总的来说，IO优化的利是大于弊的。

THE END

本文原作者 encore 大佬。

浅谈C++ IO优化——读优输优方法集锦 - 张再筵的博客

零、写在前面

一、基本读入优化

二、对于不定参数的读优重载

三、基于fread的读入优化

注意

四、输出优化

五、基于streambuf的IO优化

说明：

六、注意事项

关于streambuf优化：

其他：

七、IO优化的弊端

THE END

发表回复取消回复

零、写在前面

一、基本读入优化

二、对于不定参数的读优重载

三、基于fread的读入优化

注意

四、输出优化

五、基于streambuf的IO优化

说明：

六、注意事项

关于streambuf优化：

其他：

七、IO优化的弊端

THE END

发表回复 取消回复

发表回复取消回复