使用awk和grep进行数据抽样比较
在进行数据抽样时,我们关注所抽取的数据在整体数据中分布的均匀性。
最简单的就是均匀抽取,即每隔几行选取一行。
比如,数据文件较大时,每隔10行或者每隔100行进行抽取。
?
假如数据文件还是“msg”
我们每隔10行取一行,有两种方法:
?
方法1:nl+grep
?
awk '{if(NR%2 ==0) print $0}' msg > target_file
发布时间: 2012-07-26 12:01:08 作者: rapoo
使用awk和grep进行数据抽样比较
在进行数据抽样时,我们关注所抽取的数据在整体数据中分布的均匀性。
最简单的就是均匀抽取,即每隔几行选取一行。
比如,数据文件较大时,每隔10行或者每隔100行进行抽取。
?
假如数据文件还是“msg”
我们每隔10行取一行,有两种方法:
?
方法1:nl+grep
?
awk '{if(NR%2 ==0) print $0}' msg > target_file