sed是文本处理的强大工具,能够完美的配合正则表达式使用,功能很丰富,下面介绍如何利用sed删除指定文件中多个字符串。
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)
具体参数
a\ 在当前行下面插入文本。
i\ 在当前行上面插入文本。
c\ 把选定的行改为新的文本。
d 删除,删除选择的行。
D 删除模板块的第一行。
s 替换指定字符
h 拷贝模板块的内容到内存中的缓冲区。
H 追加模板块的内容到内存中的缓冲区。
g 获得内存缓冲区的内容,并替代当前模板块中的文本。
G 获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l 列表不能打印字符的清单。
n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p 打印模板块的行。
P(大写) 打印模板块的第一行。
q 退出Sed。
b lable 分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
r file 从file中读行。
t label if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label 错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
w file 写并追加模板块到file末尾。
W file 写并追加模板块的第一行到file末尾。
! 表示后面的命令对所有没有被选定的行发生作用。
= 打印当前行号码。
# 把注释扩展到下一个换行符以前。
例如我要删除文件中多个字符串那么:
sed -i '/havana/d;/ensembl/d;/ensembl_havana/d' annotated.gtf
# 删除annotated.gtf中的havana、ensembl、ensembl_havana名字
其中多个sed命令组合可以用以下方法:
sed '表达式' | sed '表达式'
# 等价于:
sed '表达式; 表达式'
参考文章:
1.http://www.gnu.org/software/sed/manual/sed.html
2.https://www.runoob.com/linux/linux-comm-sed.html
2.https://man.linuxde.net/sed
3.http://c.biancheng.net/view/4056.html