Shell 四剑客之grep(1)
SHELL编程四剑客之grep工具
全面搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix/Linux的grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令跟grep有细微的区别,egrep是grep的扩展,支持更多的re元字符, fgrep是fixed grep或fast grep简写,它们把所有的字母都看作单词,正则表达式中的元字符表示其自身的字面意义,不再有其他特殊的含义,一般使用比较少。
目前Linux操作系统默认使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。其语法格式及常用参数详解如下:
grep -opiton 'word' Filename
[root@www ~]# cat score.txt
Aaron Physics 87
Abel Maths 98
Rahul Chinese 90
Buck Biology 87
Byron English 85
Dave History 89
Enoch Chemistry 89
-o代表only,不会将行打印出来,只打印匹配到的
[root@www ~]# grep -o 89 score.txt
89
89
Grep 常用参数详解如下:
grep常用参数详解如下:
-a 以文本文件方式搜索;
-c 计算找到的符合行的次数;
-i 忽略大小写;
-n 顺便输出行号;
-v 反向选择,即显示不包含匹配文本的所有行;
-s 不显示不存在或无匹配文本的错误信息;
-E 允许使用egrep扩展模式匹配
-h 查询多文件时不显示文件名;
-l 查询多文件时只输出包含匹配字符的文件名;
学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换,常用在AWK、GREP、SED、VIM工具中对文本的操作。
通配符类型详解:
* 0个或者多个字符、数字;
? 匹配任意一个字符;
# 表示注解;
| 管道符号;
; 多个命令连续执行;
& 后台运行指令;
! 逻辑运算非;
[ ] 内容范围,匹配括号中内容;
{ } 命令块,多个命令匹配。
正则表达式详解:
* 前一个字符匹配0次或多次;
. 匹配除了换行符以外任意一个字符;
.* 代表任意字符;
^ 匹配行首,即以某个字符开头;
$ 匹配行尾,即以某个字符结尾;
\(..\) 标记匹配字符;
[] 匹配中括号里的任意指定字符,但只匹配一个字符;
[^] 匹配除中括号以外的任意一个字符;
\ 转义符,取消特殊含义;
\< 锚定单词的开始;
\> 锚定单词的结束;
{n} 匹配字符出现n次;
{n,} 匹配字符出现大于等于n次;
{n,m} 匹配字符至少出现n次,最多出现m次;
\w 匹配文字和数字字符,不匹配符号;
\W \w的反置形式,匹配一个或多个非单词字符,匹配符号;
\b 单词锁定符;
\s 匹配任何空白字符;
\d 匹配一个数字字符,等价于[0-9]。
常用GREP工具企业演练案列:
grep -c "test" jfedu.txt 统计test字符总行数;
grep -i "TEST" jfedu.txt 不区分大小写查找TEST所有的行;
grep -n "test" jfedu.txt 打印test的行及行号;
grep -v "test" jfedu.txt 不打印test的行;
grep "test[53]" jfedu.txt 以字符test开头,接5或者3的行;
grep "[Mm]ay" jfedu.txt 匹配M或m开头的行;
目录 返回
首页