javascript中的正则表达式使用详解


Posted in Javascript onAugust 30, 2015

[1]定义:正则又叫规则或模式,是一个强大的字符串匹配工具,在javascript中是一个对象

[2]特性

[2.1]贪婪性,匹配最长的

[2.2]懒惰性,不设置/g,则只匹配第1个

[3]两种写法:

[3.1]perl写法(使用字面量形式): var expression = /pattern/flags;

e.g. var pattern = /a/i;//匹配字符串中所有'a'的实例

[3.1.1]三个标志flags

[a]g:表示全局模式(global)

[b]i:表示不区分大小写(ignoreCase)

[c]m:表示多行模式(multiline) 

[3.2]js写法(使用RegExp构造函数):两个参数:要匹配的字符串模式、标志字符串(可选)

e.g. var pattern = new RegExp('[bc]at','i');

[注意]RegExp构造函数的两个参数都是字符串

[3.3]构造函数与字面量的区别

[注意]可以使用字面量形式定义的任何表达式,都可以使用构造函数来定义

[3.3.1]字面量写法不支持变量,只能用构造函数的形式来写

[tips]获取class元素(因为classname是变量,只能使用构造函数的形式)

function getByClass(obj,classname){
  var elements = obj.getElementsByTagName('*');
  var result = [];
  var pattern = new RegExp( '^|\\s'+ classname + '\\s|$');
  for(var i = 0; i < elements.length; i++){
    if(pattern.test(elements[i].className)){
      result.push(elements[i]);
    }
  }
}

[3.3.2]在ECMAScript3中,正则表达式字面量始终会共享同一个RegExp实例,而使用构造函数创建的每一个新RegExp实例都是一个新实例

var re = null, i;
for(i = 0; i < 10; i++){
  re = /cat/g;
  re.test('catastrophe');
}
for(i = 0; i < 10; i++){
  re = new RegExp('cat','g');
  re.test('catastrophe');
}

[3.3.3]ECMAScript5中规定,使用正则表达式字面量必须像直接调用RegExp构造函数一样,每次都创建新的RegExp实例

[4]语法

[重要事项]正则表达式中不能出现多余空格

[4.0]元字符(14个):() [] {} \ ^ $ | ? * + .

[注意]元字符必须转义,即用\ 加转义字符,用new RegExp写的正则必须双重转义

[4.1]转义字符

[4.1.0].号代表除了换行符\n之外的任意字符

[4.1.1]\d 数字 \D 非数字

[4.1.2]\w 字母、数字、下划线 \W 非字母、数字、下划线

[注意]汉字不属于\w

[4.1.3]\s 空格 \S 非空格

[4.1.4]\b 边界符,\w的左侧或右侧不是\w,则会出现一个边界符 \B非边界符

[4.1.5]\1 表示和前面相同的一个字符

[tips]找出重复项最多的字符和个数

var str = 'aaaaabbbbbdddddaaaaaaaffffffffffffffffffgggggcccccce';
var pattern = /(\w)\1+/g;
var maxLength = 0;
var maxValue = '';
var result = str.replace(pattern,function(match,match1,pos,originalText){
  if(match.length > maxLength){
    maxLength = match.length;
    maxValue = match1;
  }
})
console.log(maxLength,maxValue);//18 "f"

[4.1.6](\w)(\d)\1\2 :\1代表\w当时所代表的值,\2代表\d当时所代表的值

[注意]正则表达式中的子项必须是用小括号括起来的,并且顺序以小括号的前括号出现的顺序为准

[4.1.7]\t 制表符

[4.1.8]\v 垂直制表符

[4.1.9]\uxxxx 查找以十六进制xxxx规定的Unicode字符

[注意1][\u4e00-\u9fa5]代表中文 

[注意2]alert()和console.log()里面的字符是系统转义字符

[a]\r return 回车

[b]\n newline 换行

[c]\t table 制表符

[d]\b backspace 退格

[tips]alert里的换行不能用<br>或<br\>,而应该用\n。alert里面相当于是系统解析的,而不是浏览器

e.g.alert('http://www.baidu.com\n\t你好')

[注意3]由于RegExp构造函数的参数是字符串,所以某些情况下,需要对字符进行双重转义。所有元字符必须双重转义,已经转义过的字符也必须双重转义

//字面量模式  ->       等价的字符串
// /\[bc\]at/ 

   "\\[bc\\]at"
// /\.at/ 


  
  "\\.at"
// /name\/age/ 
  
  "name\\/age"
// /\d.\d{1,2}/  

  "\\d.\\d{1,2}"
// /\w\\hello\\123/      "\\w\\\\hello\\\\123"

[4.2]量词

[4.2.1]{n}:匹配n次

[4.2.2]{n,m}:匹配至少n次,最多m次

[4.2.3]{n,}:匹配至少n次

[4.2.4]?:相当于{0,1}

[4.2.5]*:相当于{0,}

[4.2.6]+:相当于{1,}

[4.3]位置符号

[4.3.1]^起始符号

[4.3.2]结束符号为美元符号

[4.3.3]?=肯定正向环视

[4.3.4]?!否定正向环视 

[4.4]控制符号([]:候选 |:或 ^:非 -:到)

[4.4.1](red|blue|green) 查找任何指定的选项 

[4.4.2][abc] 查找方括号之间的任何字符

[4.4.3][^abc] 查找任何不在方括号之间的字符

[4.4.4][0-9] 查找任何从0到9的数字

[4.4.5][a-z] 查找任何从小写a到小写z的字符

[4.4.6][A-Z] 查找任何从大写A到大写Z的字符

[4.4.7][A-z] 查找任何从大写A到小写z的字符

[4.4.8][adgk] 查找给定集合内的任何字符

[4.4.9][^adgk] 查找给定集合外的任何字符

[4.5]美元符号

//$$ $
//$& 
匹配整个模式的子字符串(与RegExp.lastMatch的值相同)
//$`  匹配子字符串之前的子字符串(与RegExp.leftContext的值相同)
//$'  匹配子字符串之后的子字符串(与RegExp.rightContext的值相同)
//$n   匹配第n个捕获组子字符串,其中n等于0-9。$1表示匹配第一个捕获组的子字符串(从第1个算起)
//$nn   匹配第nn个捕获组的子字符串,其中nn等于01-99
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$0'))//$0,$0,$0,$0  
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$1'))//ca,ba,sa,fa
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$2'))//t,t,t,t
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$3'))//$3,$3,$3,$3  
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$$'))//$,$,$,$
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$&'))//cat,bat,sat,fat
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,'$`'))//,cat,,cat,bat,,cat,bat,sat,
console.log('cat,bat,sat,fat'.replace(/(.a)(t)/g,"$'"))//,bat,sat,fat,,sat,fat,,fat,

[5]实例属性:通过实例属性可以获知一个正则表达式的各方面信息,但却没有多大用处,因为这些信息全都包含在模式声明中

[5.1]global:布尔值,表示是否设置了g标志

[5.2]ignoreCase: 布尔值,表示是否设置了i标志

[5.3]lastIndex: 整数,表示开始搜索下一个匹配项的字符位置,从0算起

[5.4]multiline: 布尔值,表示是否设置了标志m

[5.5]source: 正则表达式的字符串表示,按照字面量形式而非传入构造函数中的字符串模式返回

var pattern = new RegExp('\\[bc\\]at','i');
console.log(pattern.global);//false
console.log(pattern.ignoreCase);//true  
console.log(pattern.multiline);//false
console.log(pattern.lastIndex);//0
console.log(pattern.source);//'\[bc\]at'

[6]构造函数属性(静态属性):适用于作用域中的所有正则表达式,并且基于所执行的最近一次正则表达式操作而变化。关于这些属性的独特之处在于可以通过两种方式访问它们,即长属性名和短属性名。短属性名大都不是有效的ECMAScript标识符,所以必须通过方括号语法来访问它们

[6.1]使用这些属性,可以从exec()方法或text()方法执行的操作中提取出更具体的信息

//长属性名

   

   

短属性名   

   

说明
//input

         $_   

    最近一次要匹配的字符串
//lastMatch   

      $&   

     最近一次的匹配项
//lastParen   

      $+   

    最近一次匹配的捕获组
//leftContext   

    $`   

    input字符串中lastMatch之前的文本
//multiline   

   $*   

布尔值,表示是否所有表达式都使用多行模式
//rightContext   

   $'   

  input字符串中lastMarch之后的文本

[注意1]opera不支持短属性名

[注意2]opera不支持input\lastMatch\lastParen\multiline

[注意3]IE不支持multiline

var text = 'this has been a short summer';
var pattern = /(.)hort/g;
if(pattern.test(text)){
  console.log(RegExp.input);//'this has been a short summer'
  console.log(RegExp.leftContext);//'this has been a '
  console.log(RegExp.rightContext);//' summer'
  console.log(RegExp.lastMatch);//'short'
  console.log(RegExp.lastParen);//'s'
  console.log(RegExp.multiline);//false
  console.log(RegExp['$_']);//'this has been a short summer'
  console.log(RegExp['$`']);//'this has been a '
  console.log(RegExp["$'"]);//' summer'
  console.log(RegExp['$&']);//'short'
  console.log(RegExp['$+']);//'s'
  console.log(RegExp['$*']);//false  
}

[6.2]还有多达9个用于存储捕获组的构造函数属性

//RegExp.$1\RegExp.$2\RegExp.$3……到RegExp.$9分别用于存储第一、第二……第九个匹配的捕获组。在调用exec()或test()方法时,这些属性会被自动填充

var text = 'this has been a short summer';
var pattern = /(..)or(.)/g;
  if(pattern.test(text)){
    console.log(RegExp.$1);//sh
    console.log(RegExp.$2);//t
}

[7]实例方法:

[7.1]exec():专门为捕获组而设计,接受一个参数,即要应用模式的字符串。然后返回包含第一个匹配项信息的数组。在没有匹配项的情况下返回null。返回的数组包含两个额外的属性:index和input。index表示匹配项在字符串的位置,input表示应用正则表达式的字符串。在数组中,第一项是与整个模式匹配的字符串,其他项是与模式中的捕获组匹配的字符串,如果模式中没有捕获组,则该数组只包含一项

var text = 'mom and dad and baby and others';
var pattern = /mom( and dad( and baby)?)?/gi;
var matches = pattern.exec(text);
console.log(pattern,matches);
//pattern.lastIndex:20
//matches[0]:'mom and dad and baby'
//matches[1]:' and dad and baby'
//matches[2]:' and baby'
//matches.index:0
//matches.input:'mom and dad and baby and others'

[注意1]对于exec()方法而言,即使在模式中设置了全局标志(g),它每次也只会返回一个匹配项

[注意2]在不设置全局标志的情况下,在同一个字符串上多次调用exec(),将始终返回第一个匹配项的信息

[注意3]在设置全局标志的情况下,每次调用exec()都会在字符串中继续查找新匹配项

[注意4]IE8-的js实现在lastIndex属性上存在偏差,即使在非全局模式下,lastIndex属性每次也会变化

var text = 'cat,bat,sat,fat';
var pattern1 = /.at/;
var matches = pattern1.exec(text);
console.log(pattern1,matches);
//pattern1.lastIndex:0
//matches[0]:'cat'
//matches.index:0
//matches.input:'cat,bat,sat,fat'

matches = pattern1.exec(text);  
console.log(pattern1,matches);  
//pattern1.lastIndex:0
//matches[0]:'cat'
//matches.index:0
//matches.input:'cat,bat,sat,fat'
var text = 'cat,bat,sat,fat';
var pattern2 = /.at/g;
var matches = pattern2.exec(text);
console.log(pattern2,matches);  
//pattern2.lastIndex:3
//matches[0]:'cat'
//matches.index:0
//matches.input:'cat,bat,sat,fat'

matches = pattern2.exec(text);
console.log(pattern2,matches);  
//pattern2.lastIndex:7
//matches[0]:'bat'
//matches.index:4
//matches.input:'cat,bat,sat,fat'

[tips]用exec()方法找出匹配的所有位置和所有值

var string = 'j1h342jg24g234j 3g24j1';
var pattern = /\d/g;
var valueArray = [];//值
var indexArray = [];//位置
var temp = pattern.exec(string);
while(temp != null){
  valueArray.push(temp[0]);
  indexArray.push(temp.index);
  temp = pattern.exec(string);  
}
console.log(valueArray,indexArray);

[7.2]test():接受一个字符串参数,在模式与该参数匹配的情况下返回true,否则返回false

[注意]常用于只想知道目标字符串与某个模式是否匹配,但不需要知道其文本内容的情况,经常用在if语句中

var text = '000-00-000';
var pattern = /\d{3}-\d{2}-\d{4}/;
if(pattern.test(text)){
  console.log('The pattern was matched');
}

[8]模式匹配方法

[8.1]match():只接受一个参数,正则或字符串,把匹配的内容保存到一个数组中返回

[注意]加上全局标记时,match()方法返回值中没有index和input属性 

[a]不加/g

var string = 'cat,bat,sat,fat';
var pattern = /.at/;
var matches = string.match(pattern);
console.log(matches,matches.index,matches.input);//['cat'] 0 'cat,bat,sat,fat'

[b]加/g

var string = 'cat,bat,sat,fat';
var pattern = /.at/g;
var matches = string.match(pattern);
console.log(matches,matches.index,matches.input);//['cat','bat','sat','fat'] undefined undefined

[c]字符串

var string = 'cat,bat,sat,fat';
var pattern = 'at';
var matches = string.match(pattern);
console.log(matches,matches.index,matches.input);//['at'] 1 'cat,bat,sat,fat'

[8.2]search():只接受一个参数,正则或字符串,返回匹配的内容在字符串中首次出现的位置,类似于不能设置起始位置的indexOf,找不到返回-1

[a]正则(加/g和不加/g效果一样)

var string = 'cat,bat,sat,fat';
var pattern = /.at/;
var pos = string.search(pattern);
console.log(pos);//0

[b]字符串

var string = 'cat,bat,sat,fat';
var pattern = 'at';
var pos = string.search(pattern);
console.log(pos);//1

[tips]找出匹配的所有位置

function fnAllSearch(str,pattern){
  var pos = str.search(pattern); 
  var length = str.match(pattern)[0].length;
  var index = pos+length;
  var result = [];
  var last = index;
  result.push(pos);
  while(true){
    str = str.substr(index);  
    pos = str.search(pattern);
    if(pos === -1){
      break;
  }
  length = str.match(pattern)[0].length;
  index = pos+length;
  result.push(last+pos);
  last += index;  
}
return result;
}  
console.log(fnAllSearch('cat23fbat246565sa3dftf44at',/\d+/));//[3,9,17,22]

[8.3]replace():接收两个参数:第一个参数为正则表达式或字符串(待查找的内容)、第二个参数为字符串或函数(替换的内容)

[a]字符串替换

var string = 'cat,bat,sat,fat';
var result = string.replace('at','ond');
console.log(result);//'cond,bat,sat,fat'

[b]正则无/g替换

var string = 'cat,bat,sat,fat';
var result = string.replace(/at/,'ond');
console.log(result);//'cond,bat,sat,fat'

[c]正则有/g替换

var string = 'cat,bat,sat,fat';
var result = string.replace(/at/g,'ond');
console.log(result);//'cond,bond,sond,fond'

[d]函数替换:在只有一个匹配项(即与模式匹配的字符串的情况下,会向这个函数传递3个参数:模式的匹配项、模式匹配项在字符串中的位置、原始字符串。在正则表达式定义了多个捕获组的情况下,传递给函数的参数依次是模式的匹配项、第一个捕获组的匹配项、第二个捕获组的匹配项……第N个捕获组的匹配项,但最后两个参数仍然分别是模式的匹配项在字符串中的位置和原始字符串,这个函数返回一个字符串。

[tips]防止跨站脚本攻击xss(css)

function htmlEscape(text){
  return text.replace(/[<>"&]/g,function(match,pos,originalText){
    switch(match){
      case '<':
        return '<';
      case '>':
        return '>';
      case '&':
        return '&';
      case '\"':
        return '"';
    }
  });
}
console.log(htmlEscape('<p class=\"greeting\">Hello world!</p>'));
//<p class=" greeting">Hello world!</p>
console.log(htmlEscape('<p class="greeting">Hello world!</p>'));
//同上

[9]继承的方法:都返回正则表达式字面量,与创建正则表达式的方式无关。要注意的是toString()和toLocaleString()返回的正则表达式的字符串表示,而valueOf返回的是正则表达式对象本身

[9.1]toString()

[9.2]toLocaleString()

[9.3]valueOf()

var pattern = new RegExp('\\[bc\\]at','gi');
console.log(pattern.toString()); // '/\[bc\]at/gi'
console.log(pattern.toLocaleString()); // '/\[bc\]at/gi'
console.log(pattern.valueOf()); // /\[bc\]at/gi

[10]局限性:下列为ECMAScript正则表达式不支持的特性

[10.1]匹配字符串开始的结尾的\A和\Z锚(但支持以^和$来匹配字符串的开始的结尾)

[10.2]向后查找(但支持向前查找)

[10.3]并集和交集类

[10.4]原子组

[10.5]Unicode支持(单个字符除外)

[10.6]命名的捕获组(但支持编号的捕获组)

[10.7]s(single单行)和x(free-spacing无间隔)匹配模式

[10.8]条件匹配

[10.9]正则表达式注释

[11]常见实例

[11.1]两种方法找出字符串中所有的数字

[11.1.1]用传统字符串操作

var str1 = 'j1h342jg24g234j 3g24j1';
var array = [];
var temp = '';
for(var i = 0; i < str1.length; i++){
  var value = parseInt(str1.charAt(i));//如果用number将无法排除空格
    if(!isNaN(value)){
      temp += str1.charAt(i);
    }else{
      if(temp != ''){
        array.push(temp);
        temp = '';  
      }
    }
}
if(temp != ''){
  array.push(temp);
  temp = '';  
}
console.log(array);

[11.1.2]用正则表达式完成

var str1 = 'j1h342jg24g234j 3g24j1';
array = str1.match(/\d+/g);
console.log(array);

[11.2]敏感词过滤(replace回调函数的应用)

var string = 'FLG是邪教';
var pattern = /FLG|邪教/g;
var result = string.replace(pattern,function($0){
  var s = '';
  for(var i = 0; i < $0.length; i++){
    s+= '*';
  }
  return s;
})
console.log(result);

[11.3]日期格式化

var array = ['2015.7.28','2015-7-28','2015/7/28','2015.7-28','2015-7.28','2015/7---28'];
function formatDate(date){
  return date.replace(/(\d+)\D+(\d+)\D+(\d+)/,'$1'+'年'+'$2'+'月'+'$3'+'日')
}
var result = [];
for(var i = 0 ; i < array.length; i++){
  result.push(formatDate(array[i]));
}
console.log(result);

[11.4]获取网页中的文本内容

var str = '<p>refds</p><p>fasdf</p>'
var pattern = /<[^<>]+>/g;
console.log(str.replace(pattern,''));

[11.5]去除首尾空格的trim()兼容写法

var string = ' my name is littlematch ';
console.log(string.replace(/^\s+|\s+$/,''));

希望以上关于javascript中正则表达式的描述,能够对大家有所帮助。

Javascript 相关文章推荐
JavaScript prototype属性使用说明
May 13 Javascript
jQuery Tab插件 用于在Tab中显示iframe,附源码和详细说明
Jun 27 Javascript
js操作checkbox遇到的问题解决
Jun 29 Javascript
jquery鼠标停止移动事件
Dec 21 Javascript
jQuery 滑动方法slideDown向下滑动元素
Jan 16 Javascript
javascript实现数字验证码的简单实例
Feb 10 Javascript
通过JS来动态的修改url,实现对url的增删查改
Sep 01 Javascript
JQuery异步提交表单与文件上传功能示例
Jan 12 Javascript
基于vue2的table分页组件实现方法
Mar 20 Javascript
vue.js编译时给生成的文件增加版本号
Sep 17 Javascript
vue如何自动化打包测试环境和正式环境的dist/test文件
Jun 06 Javascript
解决VUE项目使用Element-ui 下拉组件的验证失效问题
Nov 07 Javascript
jQuery鼠标事件汇总
Aug 30 #Javascript
简单谈谈javascript中的变量、作用域和内存问题
Aug 30 #Javascript
jquery专业的导航菜单特效代码分享
Aug 29 #Javascript
js实现基于正则表达式的轻量提示插件
Aug 29 #Javascript
js精美的幻灯片画集特效代码分享
Aug 29 #Javascript
jQuery实现淡入淡出二级下拉导航菜单的方法
Aug 28 #Javascript
jquery实现清新实用的网页菜单效果
Aug 28 #Javascript
You might like
destoon实现VIP排名一直在前面排序的方法
2014/08/21 PHP
php按单词截取字符串的方法
2015/04/07 PHP
浅析PHP类的反射来实现依赖注入过程
2018/02/06 PHP
PHP排序算法之归并排序(Merging Sort)实例详解
2018/04/21 PHP
Jquery插件 easyUI属性汇总
2011/01/19 Javascript
js实现网站首页图片滚动显示
2013/02/04 Javascript
jQuery解决下拉框select设宽度时IE 6/7/8下option超出显示不全
2013/05/27 Javascript
Javascript表格翻页效果实现思路及代码
2013/08/23 Javascript
让jQuery Mobile不显示讨厌loading界面的方法
2014/02/19 Javascript
js确认框confirm()用法实例详解
2016/01/07 Javascript
Js遍历键值对形式对象或Map形式的方法
2016/08/08 Javascript
解析jquery easyui tree异步加载子节点问题
2017/03/08 Javascript
nodejs中向HTTP响应传送进程的输出
2017/03/19 NodeJs
node.js程序作为服务并在windows下开机自启动(用forever)
2017/03/29 Javascript
使用store来优化React组件的方法
2017/10/23 Javascript
通过一次报错详细谈谈Point事件
2018/05/17 Javascript
jQuery实现数字自动增加或者减少的动画效果示例
2018/12/11 jQuery
使用apifm-wxapi快速开发小程序过程详解
2019/08/05 Javascript
vue 页面回退mounted函数不执行的解决方案
2020/07/26 Javascript
vue中的计算属性和侦听属性
2020/11/06 Javascript
Vue项目如何引入bootstrap、elementUI、echarts
2020/11/26 Vue.js
[05:08]DOTA2-DPC中国联赛3月6日Recap集锦
2021/03/11 DOTA
使用python 获取进程pid号的方法
2014/03/10 Python
Python 爬虫多线程详解及实例代码
2016/10/08 Python
python+splinter自动刷新抢票功能
2018/09/25 Python
python 与服务器的共享文件夹交互方法
2018/12/27 Python
python实现淘宝秒杀脚本
2020/06/23 Python
Python微医挂号网医生数据抓取
2019/01/24 Python
Python 中使用 PyMySQL模块操作数据库的方法
2019/11/10 Python
深入浅析Python 命令行模块 Click
2020/03/11 Python
Pycharm中配置远程Docker运行环境的教程图解
2020/06/11 Python
宝拉珍选英国官网:Paula’s Choice英国
2019/05/29 全球购物
技术总监岗位职责
2013/12/05 职场文书
机械设计及其自动化专业求职信
2014/06/09 职场文书
领导干部群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
学校端午节活动总结
2015/02/11 职场文书