如何提高 awk 的计算速度
你这相当于没说,咋分析
上这么说有什么依据吗?
文本替换:
sed ‘s///’
gawk ‘gsub()’
perl -pe ‘s///’
ruby -pe ‘gsub!()’
取一列并做变换:
gawk ‘{print $1*2}’
perl -alne ‘print $F[0]*2’
ruby -ane ‘puts $F[0].to_i * 2’
欢迎下用 python 弄一个更简单的写法来打脸
还忘了说最近看到的一个行列结构文本处理的瑞士军刀 miller
1. 拆原文件至 90W / n ( CPU 核心数)个文件
2. shell 并行处理 拆分的文件
结果:
10484711424|foo|9999|bar
10485760000|foo|10000|bar
________________________________________________________
Executed in 76.44 millis fish external
usr time 54.70 millis 0.00 micros 54.70 millis
sys time 21.51 millis 962.00 micros 20.54 millis
硬件
CPU: Intel(R) Core(TM) i7-6700HQ CPU @ 2.60GHz
SSD: SanDisk SD8SB8U5
真是应了那句老话:当你手上有一把锤子的时候,看所有的东西都是钉子