学习大纲
一、正则表达式简介1、什么是正则表达式
正则表达式(Regular Expression 简称:RegExp或者re或者regex)又成规则表达式,描述了匹配字符串的规则(概况:有特殊含义的字符串称之为正则表达式)
在处理网页程序时候,经常需要从一个字符串中获取复杂的规则的数据,这时候就用正则表达式
2、正则表达式的作用
1)对表单域项目(用户名、密码、邮箱、qq号码、手机等等)进行验证
2)网络爬虫(一个网站到另一个网站的页面上去获取对方的相关信息)
3)内容替换、获取
前台的验证、正则处理满足条件的字符串(网络爬虫 Python编程)数据采集(大宗点评:商家评论 抓取) curl函数库:模拟http请求。
最最最常用:表单验证
二、创建正则对象
说明:创建正则表达式的方法有两种,分别叫:隐式创建、直接实例化
说明:两种方式的构造函数都是RegExp
1、隐式创建
语法:var regexp = /正则表达式/修饰符;
M //不需要加引号
2、直接实例化
语法:var regexp = new RegExp(“正则表达式”,修饰符);
3、参数说明
【必选】正则表达式:由一些普通字符和元字符组成(就是具有特殊含义的字符)【正则表达式区分大小写】
【可选】修饰符:可以使m、i、g分别表示多行匹配,i不区分大小写,g全局匹配
︴思考: /锄禾日当午/ 是不是正则表达式?
答:是的
原因:只要写在“/”和“/”直接的内容就是正则表达式
三、使用正则对象1、RegExp对象方法
test方法
– 判断正则表达式是否匹配成功
– 成功返回true,失败返回false
exec方法
– 匹配符合正则表达式条件的数据
– 成功返回数组
– 失败返回null
︴小试牛刀
下述古诗中是否含有“锄禾日当午”?
“离离原上草,一岁一枯荣。
野火烧不尽,春风吹又生。
远芳侵古道,晴翠接荒城。
又送王孙去,萋萋满别情。”
Document
//创建字符串
var str = '离离原上草,一岁一枯荣。野火烧不尽,春风吹又生。远芳侵古道,晴翠接荒城。又送王孙去,萋萋满别情。';
//创建正则对象,语法:var regexp = /正则表达式/修饰符
var regexp = /锄禾日当午/;
//onsole.log(typeof regexp);
//调用正则表达式 的test方法,判断字符串是否存在
console.log(regexp.test(str));
匹配字符串“php离离原上php草php,一岁一枯荣。野火烧不尽js去空格,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。”中的PHP?
Document
//创建字符串
var str = '_php离离原上php草php,一岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。';
//创建正则表达式对象
var regexp = /php/g; //脚下留心:需要增加修饰符g表示全局匹配,否则出现死循环
//调用exec方法匹配数据
//console.log(regexp.exec(str)); 匹配下标为1的数据
while (row = regexp.exec(str)) {
console.log(row);
}
︴课堂练习
判断字符串“Nice to meet you, how old are you? I'm 8.”中是否含有数字“3”?
var str = 'Nice to meet you, how old are you? I'm 8';
var regexp = /3/;
if (regexp.test(str)) {
有的
} else {
没有
}
︴思考a:如何判断字符串中是否含有数字?
解决:通过字符类
Document
//创建字符串
var str = '_php离离原上php草php,一8岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。';
//需求:判断字符串中是否有数字
//1.创建正则表达式对象
var regexp = /[0-9]/;
//2.判断
if (regexp.test(str)) {
alert('有');
} else {
alert('哎东特no');
}
2、支持正则表达式的 String 对象的方法1)种类
search 、 match 、 replace 、 split
2)search方法
语法:字符串对象.search(待查找的字符串|正则)
作用:用于搜索字符串中指定的元素
返回:返回符合条件的第一个元素下标,没找到返回-1
3)split方法
语法:字符串对象.split(分割符)
作用:用于以指定的符号分割字符串
返回:返回一个数组
M 如果没有指定的分隔符或者分隔符不存在,则返回的数组第一个元素是本身
4)match方法
语法:字符串对象.match(待匹配的字符串|正则表达式)
作用:匹配符合条件的内容
返回:返回一个数组
M 脚下留心:默认匹配一个,需要通过正则表达式并且加了全局参数才可以匹配多个返回一个数组
5)replace方法
语法:字符串对象.replace(待匹配的字符串|正则表达式,替换的内容)
作用:用于替换字符串中的数据
返回:返回新的字符串(替换后的字符串)
Document
var str = 'php8真厉害';
console.log(str.replace(8, 9));
var str = 'php8真厉害8';
var regexp = /d/;
console.log(str.replace(regexp, 9));
var regexp = /d/g;
console.log(str.replace(regexp, 9));
四、正则字符类1、什么是字符类?
答:就是一类字符的集合,用于匹配指定区间的数据,如:[0-9]匹配0-9任意
数字(中间“-”表示连接指区间)
小试牛刀
匹配a-z任意一个字符, 正则:[a-z]
匹配A-Z任意一个字符, 正则:[A-Z]
匹配26个英文字母(大小写), 正则:[a-zA-Z]
匹配一个数字, 正则:[0-9]
匹配一个字符可以是数字、字母和下划线:[0-9a-zA-Z_]
匹配非数字,正则:[^0-9]
匹配非字母,正则:[^a-zA-Z]
多学一早:如果需要取反在第一个“[”后面添加“^”符号即可
2、常用字符类
d 匹配数字,相当于:[0-9]
D 匹配非数字,相当于[^0-9]
w 匹配数字、字母、下划线,相当于:[0-9a-zA-Z_]
W 匹配非数字、字母、下划线,相当于:[^0-9a-zA-Z_]
s 匹配空白字符串(空格)
S 匹配非空白字符串
. 匹配所有字符
︴思考b:如何判断字符串中是否含有指定数量数字?
五、正则重复字符(限定符)1、什么是重复字符?
用于限制指定字符串出现连续次数,出现了指定次数返回true,反之返回false
举例:字符重复字符
说明:
8{3} 含义出现3次,也就是 888 888 888
8{3,} 含义出现至少3,连续8,也就88888中胜多负少的88888
2、常用重复字符
* 指重复0到多次
+ 指重复1到多次
? 指重复0到1次
{n} 指匹配n次,如:{8} 匹配8次
{n, m} 指匹配n到m次,如:{1,8} 匹配1~8次
{n, } 指匹配至少n次,如:{1,} 匹配至少1次
Document
//创建字符串
var str = '_php离离原上php草php,5689899一岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。';
//需求:判断字符串中是否有指定数量的数字
//1.创建正则表达式 匹配出现3次的数字
var regexp = /d{3}/;
if (regexp.test(str)) {
console.log('匹配出现3次的数字:有');
} else {
console.log('匹配出现3次的数字:没有');
}
//2.匹配含有3个9的数字
if (/9{3}/.test(str)) {
console.log('匹配出现练习的3个数字并且是数字9:有');
} else {
console.log('匹配出现练习的3个数字并且是数字9:没有');
}
//3.匹配数字5至少重复1次
if (/5{1,}/.test(str)) {
console.log('有');
} else {
console.log('没有');
}
if (/5+/.test(str)) {
console.log('有');
} else {
console.log('没有');
}
︴思考c: 如何判断字符串中只能是数字?
六、正则定位符1、什么是定位符?
用于来限制匹配数据的行首和行位
2、常用定位符
^ 限定行首数据
$ 限定行尾数据
■知识点综合练习 ps. 讲完内存分配继续 匹配检测是否是秋秋号,规则:5~11数字,首字母不能是0
var str = ‘888888’;
var regexp = /^[1-9]d{4,10}$/;
匹配检测是否是手机号,规则:1~11数字,首字母不能是0
var str = ‘18888888888’;
1)先匹配11位数字
var regexp = /d{11}/;
2)发现有瑕疵:首字母不能是0
var regexp = /[1-9]d{10}/;
3)发现瑕疵:两边不能写内容
var regexp = /^[1-9]d{10}$/;
匹配网站账号是否合法,规则:账号由5~12个数字、字母下划线组成,首字母不能是数字
var username = ‘’;
1)先匹配5~12个数字、字母、下划线
var regexp = /w{5,12}/
2)完善首字母不能是数字
var regexp = /[a-zA-Z_]w{4,11}/
3)两边不能写东西
var regexp = /^[a-zA-Z_]w{4,11}$/
邮箱验证
aadfasdff@163.com
sdfadf@126.com
1243123@qq.com
fadsf@gmail.com
sdfadsfdsf@sina.com
sdf1223sd@xxx.com
规律:
@前面 : 6~18个字符,可使用字母、数字、下划线,需以字母开头
@后面点前面:至少2个字符
点后面:2~5个英文字母
var email = ‘’;
1)6~18个字母、数字、下划线
var regexp = /w{6,18}/;
2)有瑕疵:首字符必须是字母
var regexp = /[a-zA-Z]w{5,17}/;
3)有瑕疵:两部不能有前天字符
var regexp = /^[a-zA-Z]w{5,17}$/;
4)有瑕疵:@后面没有匹配 点前面
var regexp = /^[a-zA-Z]w{5,17}@[a-zA-Z0-9]{2,}$/;
5)有瑕疵: 点后面
var regexp = /^[a-zA-Z]w{5,17}@[a-zA-Z0-9]{2,}.[a-z]{2,5}$/;
脚下留心:.匹配所字符,单独使用点需要转义
检测是内容是否为空
s 匹配空白字符
匹配是否全部是空格
Document
var str = 'a';
var regexp = /^s*$/;
console.log(regexp.test(str))
检测是内容是否有空格
Document
var str = ' sdfsd';
//var regexp = /8/; //匹配内容时是否含有数字8
var regexp = /s/;
console.log(regexp.test(str))
综合练习
Document
//检测是否是数字
isNum.onclick = function() {
//alert(contentObj.value);
var regexp = /^d+$/;
if (regexp.test(contentObj.value)) {
alert('是');
} else {
alert('不是');
}
}
//输出所有数字
getContent.onclick = function() {
//alert(contentObj.value);
var regexp = /d/g;
while (row = regexp.exec(contentObj.value)) {
console.log(row);
}
}
七、分枝条件1、什么是分枝条件?
就是多个规则,如果满足其中一个规则,则成功(相当于PHP中的逻辑或),用“|”一个管道表示。
练习:下述古诗中是否含有“锄禾日当午”或者“春风吹又生”?
var str = '锄禾日当午,汗滴禾下土。谁知盘中餐,粒粒皆辛苦。';
var regexp = /锄禾日当午/;
var regexp = /春风吹又生/;
var regexp = /锄禾日当午|春风吹又生/;
if (regexp.test(str)) {
有
} else {
木有
}
案例: 检测上传图片是否合法
jpg|png
var str = “xxx.jpg”;
先判断一种情况
var regexp = /^.+.jpg$/;
Document
var str = "xxx.png1";
var regexp = /^.+.jpg$|^.+.png$/;
console.log(regexp.test(str));
八、子表达式(分组)1、什么是分组?
已知:正则表达式单个字符需要重复多次可以通过【重复字符】实现,但是多个字
符串需要一起重复怎么办?
解决:通过子表达式或者叫分组
流程:给正则表达式添加“()”小括号既可以实现分组功能,然后进一步操作
2、子表达式/捕获/反向引用 概念 子表达式
在正则表达式中,给正则表达式添加“()”小括号
例如:
var str = sdfdsfd
var regexp = /sdf(d)sfd/;
捕获
就是将正则表达式中,“()”小括号匹配的内容存到内存缓冲区域
上述子表达式中,第一个小括号中捕获:d 会存到内存中
反向引用
将内存中的数据,取出来在正则表达式中使用
一个小括号:1
两个小括号:1 2
M 脚下留心:1只能在正则表达式中写
3、分组案例练习 查找连续的四个数字,如:3569
/3569/
/dddd/
/d{4}/
查找连续的相同的四个数字,如:1111
/1{4}/
/(d)111/
先将第一个放到内存里面,然后通过反向引用获取第一个分组里面的数组
查找数字,如:1221,3443
规则:ABBA
var regexp = /(d)(d)21/;
查找字符,如:AABB,TTMM
规律:AABB
var regexp = /(d)1(d)2/;
、︴优化分枝条件中判断图片是否合法
jpg|png
var str = “xxx.jpg”;
先判断一种情况
var regexp = /^.+.jpg$|^.+.png$/;
var regexp = /^.+.(jpg|png)$/
Document
var str = "sdfdsf.png";
//var regexp = /^.+.jpg$|^.+.png$/;
var regexp = /^.+.(jpg|png)$/
console.log(regexp.test(str));
举一反三
验证邮箱,可以限制最后面可以使用什么域名后缀
明确:只能使用com/cn/org
var regexp = /^[a-zA-Z]w{5,17}@[a-zA-Z0-9]{2,}.[a-z]{2,5}$/;
var regexp = /^[a-zA-Z]w{5,17}@[a-zA-Z0-9]{2,}.(com|cn|org)$/;
九、特殊用法:
(?=)正向预查:匹配以指定内容结尾的数据
(?!)反向预查:匹配不以指定内容结尾的数据
■正则表达式习题
结巴程序
结巴哥哥:我…我是是……一个……个……帅帅帅帅…哥!”;
治病:我是一个帅哥!
Document
var str = '我...我是是......一个......个......帅帅...哥!';
//字符串替换,语法:字符串对象.replace(正则或者字符串, 新字符串);
str = str.replace(/./g, '');
//匹配字符串中AA格式的数据
//我我是是一个个帅帅帅帅哥!
//我 是 个 帅
var regexp = /(.)1/g;
console.log(str.replace(regexp, '$1'));
去除字符串里面的空格(笔试写一个正则)
PHP中去空格trim()
JS没有,可以通过正则定义方法
正则中文的处理
一般在字符都存在一个编码的规则,对于中文的编码一般都是使用utf-8编码,并且js天生使用的就是utf-8对待字符串。并且utf-8的编码是存在一个范围的[u4e00-u9fa5]基本把所有常见中文都涵盖。
需求判断是否只有中文
var str = 内容
var regexp = /^[u4e00-u9fa5]$/;
console.log(regexp.test(str));
PHP正则表达式1、语法
preg_match(正则表达式,待匹配的字符串,[匹配结果])
preg_match_all(正则表达式js去空格,待匹配的字符串,[匹配结果])
M PHP正则表达式必须加引号
2、练习:判断用户名
匹配网站账号是否合法,规则:账号由5~12个数字、字母下划线组成,首字母不能是数字
$regexp = ”/^[a-zA-Z_]w{4,11}$/”;
限时特惠:本站每日持续更新海量设计资源,一年会员只需29.9元,全站资源免费下载
站长微信:ziyuanshu688