他表达的不是这个意思,如果我没记错的话,他表达的意思是,把小文件的系统调用浪费的时间刨除掉,然后用同等数据量的大文件的IO来估算拷贝时间,然后得出并不需要多线程来进行处理的结论。--这显然是错误的,为了让小文件能做和大文件同样的拷贝速度,就必须让一些文件的系统调用和另外一些文件的IO访问同时进行,这一定需要某种程度的并行/并发操作才能做到。
【 在 beijiaoff 的大作中提到: 】
: 他的留言说的是“几十秒内对比完上万个文件的瓶颈都不在iops上,如果文件小的话,比如每个文件4KB,上万个文件才4MB,即使单线程也能搞定”
: 他表达的意思正是你所说的小文件性能损耗在非磁盘环节更多,磁盘本身不是瓶颈。
: 我们已经知道磁盘4k单线程能达到4MB/s(1000iops)甚至40MB/s(10kiops),这些文件对cpu等系统的压力更大。
: ...................
--
FROM 113.233.223.*