shell 编程-04-正则表达式-天翼云

shell 编程-04-正则表达式

2024-05-31 07:36:18 阅读次数：46

一、什么是正则表达式

简单的说，正则表达式就是处理字串的方法，他是以行为单位来进行字串的处理行为，正则表达式通过一些特殊符号的辅助，可以让使用者轻易的达到“搜寻/删除/取代”某特定字串的处理程序！

正则表达式基本上是一种“表达式”，只要工具程序支持这种表达式，那么该工具程序就可以用来作为正则表达式的字串处理之用。例如 vi, grep, awk ,sed 等等工具，因为她们有支持正则表达式，所以，这些工具就可以使用正则表达式的特殊字符来进行字串的处理。但例如 cp, ls 等指令并未支持正则表达式，所以就只能使用 Bash 自己本身的通配符而已。

是 Linux 基础当中的基础，如果学成了之后，一定是“大大的有帮助”的！这就好像是金庸小说里面的学武难关：任督二脉！打通任督二脉之后，武功立刻成倍成长！

二、关于语系

在英文大小写的编码顺序中，zh_TW.big5 及 C 这两种语系的输出结果分别如下：

LANG=C 时：0 1 2 3 4 ... A B C D ... Z a b c d ...z
LANG=zh_TW 时：0 1 2 3 4 ... a A b B c C d D ... z Z

特殊符号意义

shell 编程-04-正则表达式

尤其要记住：

[:alnum:] 代表所有的大小写英文字符和数字　０－９　Ａ—Ｚ　a－z
[:alpha:] 代表任意英文大小写字符　　A－Z a－z
[:lower:] 代表小写字符　　　　　　　a－z
[:upper:] 代表大写字符 　　　　　 　A－Ｚ
[:digit:] 代表数字　　　　　　　 　０－９

三、练习示例文件

数据来源于鸟哥私房菜


"Open Source" is a good mechanism to develop programs.
apple is my favorite food.
Football game is not use feet only.
this dress doesn't fit me.
However, this dress is about $ 3183 dollars.
GNU is free air not free beer.
Her hair is very beauty.
I can't finish the test.
Oh! The soup taste good.
motorcycle is cheap than car.
This window is clear.
the symbol '*' is represented as start.
Oh!	My god!
The gd software is a library for drafting programs.
You are the best is mean you are the no. 1.
The world <Happy> is the same with "glad".
I like dog.
google is the best tools for search keyword.
goooooogle yes!
go! go! Let's go.
# I am VBird

四、匹配示例

shell 编程-04-正则表达式

shell 编程-04-正则表达式
输出：

shell 编程-04-正则表达式

输出：
shell 编程-04-正则表达式

shell 编程-04-正则表达式

输出：
shell 编程-04-正则表达式

shell 编程-04-正则表达式

输出：

shell 编程-04-正则表达式

匹配英文句点 ·
shell 编程-04-正则表达式

shell 编程-04-正则表达式

输出：
shell 编程-04-正则表达式

shell 编程-04-正则表达式

输出：
shell 编程-04-正则表达式

shell 编程-04-正则表达式

输出：

shell 编程-04-正则表达式

输出：

shell 编程-04-正则表达式

输出：

shell 编程-04-正则表达式

匹配 2 个连续的 a 字符

shell 编程-04-正则表达式

匹配 2个以上连续的 a 字符

shell 编程-04-正则表达式

匹配 3 个以下连续的字符 a

shell 编程-04-正则表达式

五、进阶 grep

-A   n  把匹配成功行之后的ｎ行也同时列出。 A 就是 after 的首字母
        就是 之后 的意思

-B   n  把匹配成功行之前的ｎ行也同时列出。B 就是 before 的首字母
        就是 之前 的意思

范例：

显示 /etc/passwd 含有 mail 的行及其前２行和后 3 行

[root@e9818e4ea8b3 ~]# grep mail -B 2 -A3 /etc/passwd
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

显示目标行(这里是含有 mail 字符)的 前 后 各 3 行

grep mail -C  3 /etc/passwd

shell 编程-04-正则表达式

只显示匹配到的字符

grep -o 'nologin' /etc/passwd

统计匹配到内容的行数，就是输出有多少行符合目标。

grep -o -c 'nologin' /etc/passwd

只要文件名

grep -l 'nologin' /etc/passwd

递归查找，就是在一个目录下查找

grep  -r  'nologin' /etc/

搜索　test 或 tast

grep -n 't[ae]st'  regular_repress.txt

搜索　oo 但其前面不要有ｇ

grep -n '[^g]oo'  regular_repress.txt

注意：当搜索的行内含有要符合搜索条件时后，此行就会忽略 明确不要的条件，比如以上的例子就可能会搜索到下面的内容

3:tool is a good tool
8:goooooogle

显示oo 前面非小写字符的行
方法一：

grep -n ‘[^a-z]oo’ regular_repress.txt

方法二：

grep -n　 ‘[^[:lower:]]oo’ regular_repress.txt

显示开头不是英文字符的行

grep -n　 ‘^[^[:alpha]]’ regular_repress.txt

符号 ^ 在 [] 内时是取反的意思，在 [] 之外是行首的意思
显示行首不是＃和；的行

grep '^[^#;]' regular_repress.txt

找到以 . 结尾的行

grep -n　　‘\.$’ regular_repress.txt

需要用　\ 进行转意

查找开头是　g 和结尾也是 g ,中间的字符可有可无

grep -n　　　'g.*g' regular_repress.txt

. 代表一个任意字符
* 代表重复零到多个在其前面的一个字符
.* 代表零个或多个任意字符

查找以ａ为开头的任意文件名
方法一：

通配符

ls -l a*

方法二：

ls |grep -n ‘^a.*’

列出 /etc 目录下的链接文件

ls -l /etc |grep ‘^l’

再统计一下多少个

ls -l /etc |grep ‘^l’ |wc -l

六、扩展正则

1 扩展正则中的符号和含义

shell 编程-04-正则表达式

2 关于分组小括号 `()` 的深入理解

写出匹配日期格式 YYYY-MM-DD 的正则表达式

[root@sharkyun ~]# echo "2019-12-30" |grep -E '[1-9][0-9]{3}-((0[1-9])|(1[0-2]))-((0[1-9])|([12][0-9])|(3[01]))'
2019-12-30
[root@sharkyun ~]# echo "1919-12-30" |grep -E '[1-9][0-9]{3}-((0[1-9])|(1[0-2]))-((0[1-9])|([12][0-9])|(3[01]))'
1919-12-30

3 支持扩展正则的工具

grep -E
egrep
sed
awk

七、正则高级部分: 贪婪|非贪婪（扩展）

贪婪就是尽可能的多匹配

非贪婪就是尽可能的少匹配，只需要在一些表示量词(就是次数)的后面加上 ?, 比如： .*? +?

1 grep 实现非贪婪

grep 或者 egrep 默认都是贪婪模式，不支持非贪婪模式。
要想实现非贪婪需要使用 -P 参数，这会使用 Perl 语言环境的正则

shell 编程-04-正则表达式

Perl 语言中:

\w 表示任意 一个 大小写字母 [a-zA-Z] 、下划线 _ 和数字 [0-9]

\d 表示任意 一个 数字 [0-9]
当然这些规则适用于大部分的编程语言，比如 python java javascript go php 等。

shell 编程-04-正则表达式

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

shell 编程-04-正则表达式

shell 编程-04-正则表达式

一、什么是正则表达式

二、关于语系

特殊符号意义

三、练习示例文件

四、匹配示例

五、进阶 grep

六、扩展正则

1 扩展正则中的符号和含义

2 关于 分组 小括号 () 的深入理解

3 支持扩展正则的工具

七、正则高级部分: 贪婪|非贪婪（扩展）

贪婪 就是尽可能的多匹配

非贪婪 就是尽可能的少匹配，只需要在一些表示量词(就是次数)的后面加上 ?, 比如： .*? +?

1 grep 实现非贪婪

相关文章

通过java调用shell脚本实现服务的重启

【QT】显示类控件和输入类控件

Js之前端实现模糊查询

js截取字符串中的数字

MySQL查询某个字段含有字母数字的值

【linux】linux环境变量|删除|添加|shell父子环境变量传递

【Shell】Shell时间相关|统计Shell脚本执行时间|sleep

【C\\C++】程序如何执行shell命令并获取执行结果|popen

【shell】遍历目录及其子目录中的所有文件|判断文件是否有修改

【shell】实现交互|read读取键盘输入

作者介绍

最新文章

【C\\C++】程序如何执行shell命令并获取执行结果|popen

shell编程（编写、执行，shell变量、传参、字符串、运算符使用）

前端练习小项目——方向感应名片

【测试】echo发送和接收TCP/UDP数据包|shell 发送TCP/UDP数据包

流程控制_基础知识_流程基础

shell编程-四种if条件语句

热门文章

C#编程-85：正则表达式语法复习

Linux脚本练习之script011-当执行程序时，让使用者选择 `boy` 或者 `girl`，如果使用者输入 `B` 或者 `b`，则显示 `He is a boy`。

shell脚本控制程序启动停止重启

shell脚本

Linux之shell编程基础

java正则表达式对特殊字符的转义

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Linux脚本练习之script011-当执行程序时，让使用者选择 `boy` 或者 `girl`，如果使用者输入 `B` 或者 `b`，则显示 `He is a boy`。

Linux shell编程学习笔记3：查询系统中已安装可以使用的shell

宗师级Linux 系统管理员的倾囊相授——《Linux命令行与shell脚本编程大全（第4版）》

Linux之shell编程和gdb调试

算法题：正则表达式匹配（题目+思路+代码+注释）

【测试】echo发送和接收TCP/UDP数据包|shell 发送TCP/UDP数据包

2 关于分组小括号 `()` 的深入理解

贪婪就是尽可能的多匹配

非贪婪就是尽可能的少匹配，只需要在一些表示量词(就是次数)的后面加上 `?`, 比如： `.*?` `+?`