网站开发岗位分析,wordpress 编辑 插件下载,专业购物网站,基于MVC网站建设课程设计报告作者#xff1a;孙玉昌#xff0c;昵称【一一哥】#xff0c;另外【壹壹哥】也是我哦 千锋教育高级教研员、CSDN博客专家、万粉博主、阿里云专家博主、掘金优质作者 前言
在上一篇文章中#xff0c;壹哥给大家介绍了String字符串及其各种常用API方法#xff0c;接下来壹哥… 作者孙玉昌昵称【一一哥】另外【壹壹哥】也是我哦 千锋教育高级教研员、CSDN博客专家、万粉博主、阿里云专家博主、掘金优质作者 前言
在上一篇文章中壹哥给大家介绍了String字符串及其各种常用API方法接下来壹哥继续给大家讲解一些String字符串的高级玩法。
有时候我们操作一个字符串时这个字符串的内容并不一定就是固定不变的。比如在用户注册时我们要求用户在输入框中输入自己的手机号码。我们知道每个人的手机号码都是不一样的那我们该如何保证用户输入的是合法的手机号呢这就需要我们在代码中对这个手机号进行验证审核不能随便输入11位数字就行了。这时就需要对用户传递过来的字符串参数进行校验。
作为一个程序员你可能会想到通过一段代码程序来进行判断但这种方法需要创建对应的判断规则然后用一堆的代码进行实现比如
boolean isValidMobileNumber(String s) {// 是否是11位if (s.length() ! 11) {return false;}// 每一位都是0~9for (int i0; is.length(); i) {char c s.charAt(i);if (c 0 || c 9) {return false;}}return true;
}
但上面的代码只是做了非常粗略的判断并未考虑首位数字不能为0等更详细的情况而且以后随着发展可能手机号不只有11位或者会有其他的规则。那时候再修改代码吗这就很麻烦
实际上在开发时如果我们想实现该功能比较普遍且靠谱的做法是利用正则表达式来进行实现。那么什么是正则表达式它有哪些特点怎么用接下来就请大家跟随壹哥来学习今天的内容吧。
----------------------------------------------前戏已做完精彩即开始--------------------------------------------
全文大约【6000】字不说废话只讲可以让你学到技术、明白原理的纯干货本文带有丰富的案例及配图视频让你更好地理解和运用文中的技术概念并可以给你带来具有足够启迪的思考......
配套开源项目资料 Github https://github.com/SunLtd/LearnJava Gitee 一一哥/从零开始学Java 一. 正则表达式
1. 简介
有挺多小伙伴之前听说过正则表达式觉得这是一个很牛逼、很神奇的知识点所以隐隐地觉得正则表达式学起来也会比较难。实际上正则表达式的学习并不难它其实是一种非常实用且简单的字符串操作工具主要是作为匹配字符串的模板能够将某个字符模式与所搜索的字符串进行对比匹配并且正则表达式只是一套标准规范和具体的某种开发语言并没有关系。也就是说正则表达式不是java、python等某个语言独有的而是在各种语言中都通用的只是在每种语言中可能会有个别细微的差别。
而在正式开始学习正则表达式之前让我们先来了解一下正则表达式的概念 正则表达式是由各种普通的字符(如a~z、A~Z、0~9)以及一些特殊字符(元字符)组成的文字模板是一种用于模式匹配和替换的规范。通俗地说我们可以把正则表达式理解成是一种可以对字符串进行各种特殊处理的工具比如可以对字符串进行【查找、提取、分割、替换】等操作。 也即是说正则表达式只是一个描述规则的字符串。所以只需要编写出正确的规则我们就可以让正则表达式去判断目标字符串是否符合规则。比如Hello World这样的字符串也是一个正则表达式它可以匹配 Hello World这个字符串。一个【点号】也是一个正则表达式它可以匹配任意一个字符如a 、A、1等。
2. 基本语法
知道了正则表达式的基本概念之后接下来我们还需要了解它的一些基本语法及其含义。以下是开发时常用的正则表达式基本语法各种复杂的正则表达式其实都是由这些基本的语法规则组成的。大家要注意正则表达式的匹配规则都是按照从左到右进行匹配的并且通过不同的符号组合可以实现对字符串的精确匹配、模糊匹配也可以匹配字母、数字、各种符号等。 字符 说明 () 标记子表达式的开始和结束位置。要匹配这些字符请使用\(和\) [] 用于确定中括号表达式的开始和结束位置。要匹配这些字符请使用\[和\] {} 用于标记前面子表达式的出现频度。要匹配这些字符请使用\{和\} \ 代表转义字符将下个一字符标记为特殊字符、文本、反向引用或八进制转义符。例如 n匹配字符 n\n 匹配换行符序列 \\\\ 匹配 \\ \\( 匹配 (。 | 指定两项之间任选一项。如果要匹配丨字符本身请使用\| ^ 表示否定例如[^abc]表示非 a、b、c 的任意字符[^a-f]表示不是 a~f 范围内的任意字符 $ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性$ 还会与\n或\r之前的位置匹配。 * 表示零次或多次匹配前面的字符或子表达式。例如zo* 匹配z和zoo* 等同于 {0,}。 表示一次或多次匹配前面的字符或子表达式。例如zo与zo和zoo匹配但与z不匹配。 等效于 {1,}。 ? 表示零次或一次匹配前面的字符或子表达式。例如do(es)?匹配do或does中的do。? 等效于 {0,1}。 “与”运算 例如 [a-z[def]]是 a~z 和 [def] 的交集表示 d、e f[a-z^bc]]是 a~z 范围内除 b 和 c 之外的所有字符 [ad-z] [a-z[m-p]]是 a~z 范围内除 m~p 范围之外的字符的所有字符 “并”运算 并运算与前面的枚举类似例如[a-d[m-p]]表示 [a-dm-p] {n} n 是非负整数表示正好匹配 n 次。例如o{2}与Bob中的o不匹配但与food中的两个o匹配。 {n,} n 是非负整数表示至少匹配 n 次。例如o{2,}不匹配Bob中的o而匹配foooood中的所有 o。o{1,}等效于o。o{0,}等效于o*。 {n,m} m 和 n 是非负整数其中 n m表示匹配至少 n 次至多 m 次。例如o{1,3}匹配fooooood中的头三个 o。o{0,1} 等效于 o?。注意逗号和数字之间不能有空格。 ? 当此字符紧随任何其他限定符*、、?、{n}、{n,}、{n,m}之后时匹配模式是非贪心的。非贪心的模式表示匹配搜索到尽可能短的字符串而默认贪心的模式则会匹配搜索到尽可能长的字符串。例如在字符串oooo中o?只匹配单个o而o匹配所有o。 . 代表除\r\n之外的任何单个字符。若要匹配包括\r\n在内的任意字符请使用诸如[\s\S]之类的模式。 (pattern) 代表pattern并捕获与之匹配的子表达式。可以使用 $0…$9 属性从匹配集合中检索捕获的匹配。若要匹配括号字符 ( )请使用\(或者\)。 (?:pattern) 代表pattern但不捕获与之匹配的子表达式即它是一个非捕获匹配不存储供以后使用的匹配。这对用or字符 (|) 组合模式部件的情况很有用例如industr(?:y|ies) 是比 industry|industries 更经济的表达式。 (?pattern) 执行正向预测先行搜索的子表达式该表达式匹配处于匹配 pattern 的字符串的起始点的字符串。它是一个非捕获匹配即不能捕获供以后使用的匹配。例如Windows (?95|98|NT|2000) 匹配Windows 2000中的Windows但不匹配Windows 3.1中的Windows。预测先行不占用字符即发生匹配后下一匹配的搜索紧随上一匹配之后而不是在组成预测先行的字符后。 (?!pattern) 执行反向预测先行搜索的子表达式该表达式匹配不处于匹配 pattern 的字符串的起始点的搜索字符串。它是一个非捕获匹配即不能捕获供以后使用的匹配。例如Windows (?!95|98|NT|2000) 匹配Windows 3.1中的 Windows但不匹配Windows 2000中的Windows。预测先行不占用字符即发生匹配后下一匹配的搜索紧随上一匹配之后而不是在组成预测先行的字符后。 x|y 代表 x 或 y。例如z|food 匹配z或food。(z|f)ood 匹配zood或food。 X 字符xx代表任何合法的字符) [xyz] 字符集。匹配包含的任一指定字符。例如[abc]匹配plain中的a。 [^xyz] 代表反向字符集。匹配未包含在指定字符集的任何字符。例如[^abc]可以匹配plain中plin。 [a-z] 枚举字符范围匹配指定范围内的任何字符。例如[a-z]用于匹配a到z范围内的任何小写字母。 [^a-z] 反向范围字符匹配不在指定范围内的任何字符。例如[^a-z]匹配所有不在a到z范围内的任何字符。 \b 匹配一个字边界即字与空格间的位置。例如er\b匹配never中的er但不匹配verb中的er。 \B 代表非字边界。er\B匹配verb中的er但不匹配never中的er。 \cx 匹配 x 指示的控制字符。例如\cM 匹配 Control-M 或回车符。x 的值必须在 A-Z 或 a-z 之间。如果不是这样则假定 c 就是c字符本身。 \d d即digit代表数字字符等效于 [0-9]。 \D 代表非数字字符等效于 [^0-9]。 \f 代表换页符等效于 \x0c 和 \cL。 \n 代表换行符等效于 \x0a 和 \cJ。 \r 代表一个回车符等效于 \x0d 和 \cM。 \s s即space代表任何空白字符包括空格、制表符、换页符等。与 [ \f\n\r\t\v] 等效。 \S 代表任何非空白字符与 [^ \f\n\r\t\v] 等效。 \t 代表制表符与 \x09 和 \cI 等效。 \v 代表垂直制表符与 \x0b 和 \cK 等效。 \w w即word代表任何字类字符包括下划线。与[A-Za-z0-9_]等效。 \W 代表任何非单词字符与[^A-Za-z0-9_]等效。 \xn 代表n此处的 n 是一个十六进制转义码。十六进制转义码必须正好是两位数长。例如\x41匹配A。\x041与\x041等效。允许在正则表达式中使用 ASCII 代码。 \num 代表num此处的 num 是一个正整数。到捕获匹配的反向引用。例如(.)\1匹配两个连续的相同字符。 \n 标识一个八进制转义码或反向引用。如果 \n 前面至少有 n 个捕获子表达式那么 n 是反向引用。否则如果 n 是八进制数 (0-7)那么 n 是八进制转义码。 \nm 标识一个八进制转义码或反向引用。如果 \nm 前面至少有 nm 个捕获子表达式那么 nm 是反向引用。如果 \nm 前面至少有 n 个捕获则 n 是反向引用后面跟有字符 m。如果两种前面的情况都不存在则 \nm 匹配八进制值 nm其中 n 和 m 是八进制数字 (0-7)。 \nml 当 n 是八进制数 (0-3)m 和 l 是八进制数 (0-7) 时匹配八进制转义码 nml。 \un 代表n其中 n 是以四位十六进制数表示的 Unicode 字符。例如\u00A9 匹配版权符号 (©)。
有的小伙伴会说上面这么多的规则我记不住啊其实大家不用担心我们没必要把以上这些规则都记住只需记住几个常用的语法规则以后开发时如果需要编写正则表达式随时查阅API就可以了。而且现在网上也有很多第三方的正则表达式编写网站很多常用的表达式都已经写好了我们只需要将这些规则直接拿来用即可。但是我们需要知道基本的规则这样当有特殊需要时才能灵活修改组合满足我们的特殊需求。
当然我们在开发时编写的正则表达式并不会像上表中展示的那样简单可能是很复杂。但不管如何这些复杂的表达式都是由这些基本的语法规则组成的我们了解这些基本规则即可。
3. 常用API
3.1 String中的正则表达式操作方法
为了让我们方便操作正则表达式String类给我们提供了如下几个API方法可以让我们结合正则表达式对字符串进行各种操作 boolean matches(String regex)判断该字符串是否匹配了指定的正则表达式String replaceAll(String regex, String replacement)将该字符串中所有匹配了regex规则的子串都替换成replacementString replaceFirst(String regex, String replacement)将该字符串中第一个匹配regex规则的子串替换成replacementString[] split(String regex)以regex作为分隔符把该字符串分割成多个子串。 以上API方法的使用格式如下所示
//正则表达式
String reg a*c;
//对某个字符串进行匹配判断
boolean resultabc.matches(reg);//利用正则表达式对字符串进行替换把用不规范的连续空格分隔的句子变成规范的句子
String s The fast\t\t snow down on the land cat.;
String r s.replaceAll(\\s, );
3.2 正则表达式相关的操作类
上面这些方法都是Java提供的用于操作正则表达式的API方法另外在java.util.regex包中也提供了以下三个可以操作正则表达式的类 Pattern类Pattern对象是正则表达式编译后在内存中的表示形式因此正则表达式字符串必须先被编译为 Pattern对象然后再利用该 Pattern对象创建对应的Matcher对象。执行匹配所涉及的状态保留在Matcher对象中多个Matcher对象可共享同一个Pattern对象。Pattern类没有公共的构造方法。如果我们想要创建Pattern对象可以调用其公共的静态方法compile()它会返回一个Pattern对象且该方法要接受一个正则表达式作为它的第一个参数。Matcher类Matcher类是对输入的字符串进行解释和匹配操作的引擎该类也没有公共的构造方法我们可以通过Pattern对象的matcher()方法来获得一个Matcher对象。PatternSyntaxException类PatternSyntaxException是一个非强制的异常类它可以表示在正则表达式中出现的语法异常。 以上API类的使用格式如下所示
//将一个正则表达式字符串编译成Pattern对象
Pattern p Pattern.compile(某个正则表达式如a*b);//使用Pattern对象创建Matcher对象,匹配某个字符串
Matcher m p.matcher(abbbb);//返回匹配结果此处会返回true
boolean b m.matches();
二. 基本使用
了解了以上这些基础内容之后接下来壹哥再通过几个实际案例来带大家综合运用一下上面的内容。
1. 验证电话号码
我们在访问网站或APP时经常会需要我们通过手机号来注册个会员这时就需要我们输入电话号码。这个电话号码包括手机号码或者固定电话两种情况两者的格式有点不同。但不管怎么样网站或APP都会验证用户输入的电话号码是否合法否则就会给用户一些提示。接下来壹哥就给大家设计一个验证电话号码是否合法的案例通过本案例来综合练习一下前面学习过的内容。
1.1 正则表达式
壹哥直接给大家贴出了如下正则表达式该正则表达式就可以用于验证电话号码是否合法。
String regex 0\\d{2,3}[-]?\\d{7,8}|0\\d{2,3}\\s?\\d{7,8}|18[0-9]\\d{8}|15[1234]\\d{8};
接下来壹哥再给大家解释一下该表达式的含义。
1.1.1 匹配固定电话 首先电话号码包括固定电话和手机号码其中固定电话由区号和号码组成手机号目前是11位纯数字固话的区号部分以 0 开头后面是 2~3 位数因此在匹配区号时可以使用0\d{2,3}这个正则表达式固话的号码部分由 7~8 位数字组成因此可以使用\d{7,8}表达式来进行匹配又因为固定电话的组合方式可能是“区号-号码” 或 “区号号码”因此匹配固定电话号码时可以使用“0\\d{2,3}[-]?\\d{7,8}|0\\d{2,3}\\s?\\d{7,8}”表达式。 1.1.2 匹配手机号码 手机号码是11位纯数字一般以数字“1x”开头但不同运营商的手机号开头并不相同。考虑到手机号码的特殊性本案例只给大家示范18xxxxxxxxx和15xxxxxxxxx号段的手机号我们可以使用“18[0-9]\\d{8}|15[1234]\\d{8}”这个表达式进行匹配。该正则表达式会验证以18或15开头的手机号码且15开头的手机号码第3位数字只能是1、2、3、4中的一个。 1.2 代码实现
分析完了电话号码的正则表达式我们再看看如何在Java代码中进行实现。
import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;/**
* author 一一哥Sun
*/
public class Demo11 {public static void main(String[] args) {//定义一个用于匹配电话号码的正则表达式String regex 0\\d{2,3}[-]?\\d{7,8}|0\\d{2,3}\\s?\\d{7,8}|18[0-9]\\d{8}|15[1234]\\d{8};//定义一个结束循环的标志位String flag Y;do {System.out.print(请输入电话号码);// 接收用户在控制台输入的电话号码Scanner scan new Scanner(System.in);String phone scan.next(); // 编译正则表达式Pattern pattern Pattern.compile(regex); // 创建给定输入模式的匹配器Matcher matcher pattern.matcher(phone); //进行字符串的匹配boolean bool matcher.matches();if(bool) { // 如果验证通过System.out.println(电话号码格式可用);} else {System.out.println(电话号码不可用请重新输入!);}System.out.print(是否继续注册(请输入 Y/N 或 y/n));flagscan.next();}while(flag.equalsIgnoreCase(Y));System.out.println(注册结束!);}
}
在本案例中我们使用 do…while 语句进行循环判断接收用户在控制台输入的电话号码接着通过Pattern类进行编译创建给定输入模式的匹配器调用 matches()方法返回匹配的结果。如果结果为true则表示验证通过如果为false则表示验证失败。最后再通过输入Y或N来判断是否结束循环。
2. 验证身份证号
2.1 身份证规则简介
我们知道目前国内的二代身份证一般都是18位的但因为历史遗留原因还有个别一代身份证号码可能是15位的。一般18位或15位的身份证号码格式如下 十八位号码xxxxxx yyyy MM dd 375 0十五位号码xxxxxx yy MM dd 75 0 其中身份证包含地区、日期、特殊字符来组成一般的组成规则如下 地区是6位的纯数字[1-9][0-9]{5}年份的前两位目前只能是18、19、20(18|19|20) 表示18-20年份的后两位可以是0-9之间的数字 [0-9]{2} 即00-99月份只有12个((0[1-9])|(10|11|12)) 即01-12天数最多到31(([0-2][1-9])|10|20|30|31) 即1-31这里无法对二月份特殊处理18位身份证后三位的顺序码[0-9]{3}即000-99915位身份证后两位的顺序码[0-9]{2}即00-99最后的校验码15位身份证号的是[0-9] 18位身份证号的则是([0-9]|(X|x))只有18位的才会出现Xx。 2.2 正则表达式
根据上面的规则分析我们就可以设计出身份证号码对应的正则表达式。
//18位号码
String id_18^[1-9][0-9]{5}(18|19|20)[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[0-9]{3}([0-9]|(X|x));//15位号码
String id_15^[1-9][0-9]{5}[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[0-9]{2}[0-9];
2.3 代码实现
接下来我们就在Java代码中对身份证号进行验证看看是否合法。
public class Demo13 {public static void main(String[] args) {//18位号码的正则表达式String reg18 ^[1-9][0-9]{5}(18|19|20)[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[0-9]{3}([0-9]|(X|x));//15位号码的正则表达式String reg15 ^[1-9][0-9]{5}[0-9]{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)[0-9]{2}[0-9];//编译正则表达式String validStr ( reg18 ) | ( reg15 );Pattern pattern Pattern.compile(validStr);//匹配身份证号是否合法,请在这里传入自己18/15位的身份证号Matcher matcher pattern.matcher(140826198812190122);System.out.println(身份证号是否合法matcher.matches());}}
-----------------------------------------------正片已结束来根事后烟---------------------------------------------
三. 结语
至此壹哥就把正则表达式给大家简单地介绍完了今天的重点内容如下 掌握正则表达式的基本语法规则掌握Java代码中使用正则表达式了解几个常用的正则表达式匹配规则比如手机号、身份证号等的验证 另外如果你独自学习觉得有很多困难可以加入壹哥的学习互助群大家一起交流学习。
四. 今日作业
作业1
在正则表达式中*、、三个符号有什么区别请在评论区说出你的答案。
作业2
请设计一个正则表达式验证一个电子邮箱格式是否合法。