查看: 63062|回复: 62

【Python 第58课】正则表达式（4）

174 主题	45 好友	11万积分

管理员

Rank: 9 Rank: 9 Rank: 9

发消息

电梯直达

楼主

发表于 2013-9-23 20:10:57 |只看该作者 |倒序浏览

1.

我们已经了解了正则表达式中的一些特殊符号，如\b、\d、.、\S等等。这些具有特殊意义的专用字符被称作“元字符”。常用的元字符还有：

\w - 匹配字母或数字或下划线或汉字（我试验下了，发现3.x版本可以匹配汉字，但2.x版本不可以）
\s - 匹配任意的空白符
^ - 匹配字符串的开始
$ - 匹配字符串的结束

2.
\S其实就是\s的反义，任意不是空白符的字符。同理，还有：

\W - 匹配任意不是字母，数字，下划线，汉字的字符
\D - 匹配任意非数字的字符
\B - 匹配不是单词开头或结束的位置

[a]的反义是[^a]，表示除a以外的任意字符。[^abcd]就是除abcd以外的任意字符。

3.
之前我们用过*、+、{}来表示字符的重复。其他重复的方式还有：

? - 重复零次或一次
{n,} - 重复n次或更多次
{n,m} - 重复n到m次

正则表达式不只是用来从一大段文字中抓取信息，很多时候也被用来判断输入的文本是否符合规范，或进行分类。来点例子看看：
^\w{4,12}$
这个表示一段4到12位的字符，包括字母或数字或下划线或汉字，可以用来作为用户注册时检测用户名的规则。（但汉字在python2.x里面可能会有问题）

\d{15,18}
表示15到18位的数字，可以用来检测身份证号码

^1\d*x?
以1开头的一串数字，数字结尾有字母x，也可以没有。有的话就带上x。

另外再说一下之前提到的转义字符\。如果我们确实要匹配.或者*字符本身，而不是要它们所代表的元字符，那就需要用\.或\*。\本身也需要用\\。
比如"\d+\.\d+"可以匹配出123.456这样的结果。

留一道稍稍有难度的习题：
写一个正则表达式，能匹配出多种格式的电话号码，包括
(021)88776543
010-55667890
02584453362
0571 66345673

#==== Crossin的编程教室 ====#
微信ID：crossincode
论坛：http://crossin.me
QQ群：156630350

面向零基础初学者的编程课
每天5分钟，轻松学编程

表达式

收藏0

回帖奖励 +3

\(?0\d{2,3}[) -]?\d{8}

挽尊！

使用道具举报

liqing215

0 主题	0 好友	65 积分

注册会员

Rank: 2

发消息

板凳

发表于 2013-9-24 19:44:37 |只看该作者

回帖奖励 +3

提问crossin先生：
您的微信公众帐号后面是用编辑模式还是开发模式啊？
用开发模式的话它自带的是用php写的，要是python的话不知道怎么改写，

使用道具举报

liqing215

0 主题	0 好友	65 积分

注册会员

Rank: 2

发消息

地板

发表于 2013-9-24 19:45:21 |只看该作者

liqing215 发表于 2013-9-24 19:44
提问crossin先生：
您的微信公众帐号后面是用编辑模式还是开发模式啊？
用开发模式的话它自带 ...

学了一点点web.py，是不是用Djingo会好些？

使用道具举报

liqing215

0 主题	0 好友	65 积分

注册会员

Rank: 2

发消息

5^#

发表于 2013-9-24 19:54:45 |只看该作者

aresli 发表于 2013-9-24 17:26
\(?0\d{2,3}[) -]?\d{8}

挽尊！

不是最后一种是空白符么。

使用道具举报

aresli

0 主题	1 好友	132 积分

注册会员

Rank: 2

发消息

6^#

发表于 2013-9-25 10:16:41 |只看该作者

liqing215 发表于 2013-9-24 19:54
不是最后一种是空白符么。

什么空白符？

使用道具举报

crossin先生

174 主题	45 好友	11万积分

管理员

Rank: 9 Rank: 9 Rank: 9

发消息

7^#

发表于 2013-9-25 12:41:12 |只看该作者

liqing215 发表于 2013-9-24 19:44
提问crossin先生：
您的微信公众帐号后面是用编辑模式还是开发模式啊？
用开发模式的话它自带 ...

编辑模式

开发模式就不能用微信自带的功能了。
用python也可以，本质上就是收到一个xml文件，再返回一个xml文件

#==== Crossin的编程教室 ====#
微信ID：crossincode
网站：http://crossincode.com

使用道具举报

fl0w

0 主题	0 好友	389 积分

中级会员

Rank: 3 Rank: 3

发消息

8^#

发表于 2013-9-25 16:00:22 |只看该作者

回帖奖励 +3

r'[(]?0\d{2,3}[)]?[-]?[ ]?\d{8}'    #这样通过
r'[(]?0\d{2,3}[)-]?[ ]?\d{8}'          #这样通过
r'[(]?0\d{2,3}[)- ]?\d{8}'                #这样不通过
r'(?0\d{2,3}[)- ]?\d{8}'                   #这样不通过
r'(?0\d{2,3}[)]?[-]?[ ]?\d{8}'    #这样不通过

使用道具举报