Advertisement

SQL Server 如何使用正则表达式搜索

阅读量:

为什么80%的码农都做不了架构师?>>>

hot3.png

使用正则表达式进行查找

当您希望在'快速查找'、'文件内查找'、'快速替换'或'文件内替换'的操作过程中启用搜索功能时,请勾选'启用搜索选项'并选择'正则表达式'选项。

搜索内容字段旁的小三角符号按钮处于可使用状态。点击该按钮即可呈现一组最常用的标准正则表达式。一旦在表达式生成器中进行了选择操作,则该选定项会被插入至当前的'搜索内容'字符串中。

|

注意
注意
“查找内容”字符串中使用的正则表达式与 Microsoft .NET Framework 编程中的有效正则表达式相比,语法上存在差异。例如,在“查找和替换”对话框中,大括号 {} 用于表示带标记的表达式。所以,表达式“zo{1}”将匹配所有“zo”后带标记 1 的匹配项,如“Alonzo1”和“Gonzo1”。但在 .NET Framework 中,{} 符号用于表示量词。因此,表达式“zo{1}”将匹配所有“z”后跟一个“o”的匹配项,如匹配“zone”,但不匹配“zoo”。

下表对“引用列表”中提供的正则表达式进行了说明。

表达式 语法 说明
任何单个字符 . 匹配除换行符外的所有单一字符。
零个或更多 * 匹配零或更多前导表达式的匹配项,执行所有可能的匹配。
一个或更多 + 匹配至少一个前导表达式的匹配项。
行首 ^ 仅匹配行首位置的字符串。
行尾 $ 仅匹配行尾位置的字符串。
字首 < 仅匹配文本中以此开头的字。
字尾 > 仅匹配文本中以此结尾的字。
分行符 \n 匹配与平台无关的换行符。在替换表达式中,插入一个换行符。
在集合中的任何一个字符 [] 匹配 [] 中的任何一个字符。若要指定字符范围,请列出起始字符和结束字符,并用短划线 (-) 分隔,如 [a-z]。
不在集合中的任何一个字符 [^...] 匹配不在 ^ 之后的字符集中的任何一个字符。
匹配“或”符号 ( ) 两旁的任一表达式。常用于组中。例如,(sponge mud) bath 可以匹配“sponge bath”和“mud bath”。
Escape |将反斜杠 () 后的字符作为文字匹配。此表达式允许您搜索正则表达式标记中使用的符号,如 { 和 ^。例如, ^ 可用于查找字符 ^。
标记表达式 {} 匹配用括起来的表达式内的文本。
C/C++ 标识符 :i 匹配表达式 ([a-zA-Z_][a-zA-Z0-9_]*)。
用引号括起来的字符串 :q 匹配表达式 (("[^"]*") ('[^']*'))。
空格或制表符 :b 匹配空格或制表符。
整数 :z 匹配表达式 ([0-9]+)。

引用列表中仅罗列了少数可用于"查找和替换"操作的正则表达式。还可以添加任意一个符合要求的正则表达式到"查找内容"字符串中。

表达式 语法 说明
最少 - 零个或更多 @ 匹配零个或更多前导表达式的匹配项,匹配尽可能少的字符。
最少 - 一个或更多 # 匹配一个或更多前导表达式的匹配项,匹配尽可能少的字符。
重复 n 次 ^n 匹配前导表达式的 n 个匹配项。例如,[0-9]^4 匹配所有四位数序列。
分组 () 将子表达式分组
第 n 个标记文本 \n 在“查找或替换”表达式中,指示匹配第 n 个标记表达式的文本,其中 n 为 1 到 9 之间的数字。 在“替换”表达式中,\0 将插入完整的匹配文本。
右对齐字段 \(w,n) 在“替换”表达式中,在宽度至少为 w 个字符的字段中,右对齐第 n 个标记表达式。
左对齐字段 \(-w,n) 在“替换”表达式中,在宽度至少为 w 个字符的字段中,左对齐第 n 个标记表达式。
阻止匹配 ~(X) 如果在表达式的此处出现 X,则阻止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,但不匹配“reality”中的“real”。
字母数字字符 :a 匹配表达式 ([a-zA-Z0-9])。
字母字符 :c 匹配表达式 ([a-zA-Z])。
十进制数字 :d 匹配表达式 ([0-9])。
十六进制数 :h 匹配表达式 ([0-9a-fA-F]+)。
有理数 :n 匹配表达式 (([0-9]+.[0-9]*) ([0-9]*.[0-9]+) ([0-9]+))。
字母字符串 :w 匹配表达式 ([a-zA-Z]+)。
Escape \e Unicode U+001B。
响铃 \g Unicode U+0007。
Backspace \h Unicode U+0008。
制表符 \t 匹配制表符,Unicode U+0009。
Unicode 字符 \x#### 或 \u#### 匹配由 Unicode 值确定的字符,其中 #### 为十六进制数字。可以使用 ISO 10646 码位或给出代理项对值的两个 Unicode 码位,指定基本多语言面(即代理项)以外的字符。

下表罗列了按规范 Unicode 字符属性进行匹配的标准语法。双字母符号与 Unicode 标准数据库中的符号一致。这些符号可归类为字符集的一部分。如上文所述的例子所示,表达式 [:Nd:Nl:No] 被用于匹配任何数字。

表达式 语法 说明
大写字母 :Lu 匹配任何单个大写字母。例如,:Luhe 匹配“The”,但不匹配“the”。
小写字母 :Ll 匹配任何单个小写字母。例如,:Llhe 匹配“the”,但不匹配“The”。
标题大写字母 :Lt 匹配一个大写字母后跟一个小写字母的字符,例如 Nj 和 Dz。
修饰字母 :Lm 匹配字母或标点符号(如逗号、交叉重音符和秒号),这些字母或标点符号是用于修饰前导字母的。
其他字母 :Lo 匹配其他字母,如歌特字母 ahsa。
十进制数字 :Nd 匹配十进制数字(如 0-9)及其全角对等数字。
字母数字 :Nl 匹配字母数字,如罗马数字和零的表意数字。
其他数字 :No 匹配其他数字,如旧斜体数字一。
左标点 :Ps 匹配左标点,如左小括号和左大括号。
右标点 :Pe 匹配右标点,如右小括号和右大括号。
左引号 :Pi 匹配左双引号。
右引号 :Pf 匹配单引号和右双引号。
划线号 :Pd 匹配划线号。
连接号 :Pc 匹配下划线符号。
其他标点 :Po 匹配 (,)、?、"、!、@、#、%、&、*、\、(:)、(;)、' 和 /。
空格分隔符 :Zs 匹配空格。
行分隔符 :Zl 匹配 Unicode 字符 U+2028。
段落分隔符 :Zp 匹配 Unicode 字符 U+2029。
不占位标记 :Mn 匹配不占位标记。
合并标记 :Mc 匹配合并标记。
封闭标记 :Me 匹配封闭标记。
数学符号 :Sm 匹配 +、=、~、 、< 和 >。
货币符号 :Sc 匹配 $ 和其他货币符号。
修饰符号 :Sk 匹配修饰符号,如抑扬符、重音符和长音符。
其他符号 :So 匹配其他符号,如版权符号、段落标记和度数符号。
其他控制 :Cc 匹配行尾。
其他格式 :Cf 格式化控制字符,如双向控制字符。
代理项 :Cs 匹配代理项对的一半。
其他专门用途 :Co 匹配任何专用区域的字符。
其他未分配字符 :Cn 匹配未映射到 Unicode 字符的字符。

除开标准的 Unicode 字符特性外, 其他附加特性也可以被视为一组完整的编码方案.

表达式 语法 说明
字母 :Al 匹配任何单字符。例如,:Alhe 匹配“The”、“then” 和“reached”之类的字。
Numeric :Nu 匹配任何数字。
标点 :Pu 匹配任意一个标点符号,如 ?、@、 ' 等等。
空格 :Wh 匹配任何类型的空格,包括印刷空格和表意空格。
双向 :Bi 匹配自右至左书写的字符,如阿拉伯语和希伯莱语字符。
朝鲜文字 :Ha 匹配朝鲜文字字母和组合字母。
平假名 :Hi 匹配平假名字符。
片假名 :Ka 匹配片假名字符。
象形/汉字/日文汉字 :Id 匹配象形字符,如汉字和日文汉字。

用于查找文本的正则表达式

Expression Studio 4.0

借助正则表达式,在Microsoft Expression Web中可以实现复杂的查找和替换操作。当您不了解所需确切的文本或代码内容时,请根据需求选择是否寻找多个匹配项来确定是否需要使用正表达式。

正则表达式是一种用于描述可搜索文本模式的语言结构。其构成包括基本字符集合(如字母a至z)以及用于定义复杂模式的关键符号(例如星号*)。例如,在网站中搜索与'page'相关的各种形式时,通过使用通配符*来匹配不同长度或前缀的情况。因此,在Expression Web中进行搜索时,系统将识别并列出所有以'page'开头或包含该关键词的不同变体。

当在搜索过程中采用正则表达式时

当需要执行操作时,请参考使用查找和替换编辑多个网页以获取更多信息

正则表达式语法

语法 表达式说明
. 任意字符 用作换行符 (\n) 以外的任何单个打印或非打印字符的通配符。 例如,正则表达式 c.t 可匹配 cat、c t、cot 等字符串,但不能匹配 cost。在本例中,句点 (.) 是一个代表单个字符的通配符。它出现在字母“c”和“t”之间,因此字符“c”和“t”之间的任何单个字符都与表达式匹配 - 即使是空格也一样。
* 最大为零或更多 用于匹配在此表达式之前出现零次或更多次的某个字符,可与尽可能多的字符相匹配。 正则表达式 .* 用于匹配某个出现零次或更多次的字符。 例如,正则表达式 b.k 可匹配 book、back、black、blank 和 buck。在本例中,将句点 (.) 和星号 () 组合成一个语法。句号 (.) 紧挨在星号 () 表达式之前。星号 () 可匹配“b”和“k”之间任意出现零次或更多次的字符。句点 (.) 用作“b”和“k”之间字符的通配符。在本例中,它表示“b”和“k”之间的任意字符都可以反复出现。
+ 最大为一或更多 用于匹配在此表达式之前出现一次或更多次的某个字符,可与尽可能多的字符相匹配。 正则表达式 .+ 用于匹配某个出现一次或更多次的字符。 例如,正则表达式 bo+. 可匹配 bob、book 和 boot。在本例中,将句点 (.) 和加号 (+) 组合成一个语法。句号 (.) 紧挨在加号 (+) 表达式之后。加号 (+) 可与出现一次或更多次的字母“o”相匹配。句点 (.) 用作每个单词的最后一个字符的通配符。在本例中,该字符为“b”、“k”和“t”。
@ 最小为零或更多 用于匹配在此表达式之前出现零次或更多次的某个字符,可与尽可能少的字符相匹配。 正则表达式 .@ 用于匹配某个出现零次或更多次的字符。 例如,正则表达式 a.@x 可匹配“abxbxb”中的“abx”和“acxcxc”中的“acx”。在本例中,将句号 (.) 和 @ 符号组合成一个语法。句点 (.) 紧挨在 @ 符号表达式之前。@ 符号可与“a”和“x”之间出现零次或更多次的任意字符相匹配。在本例中,句点 (.) 用作字符“a”和“x”之间的字符“b”和“c”的通配符。
# 最小为一或更多 用于匹配在此表达式之前出现一次或更多次的某个字符,可与尽可能少的字符相匹配。 例如,正则表达式 si.#er 可匹配“sicker”或“silkier”。在本例中,将句号 (.) 和井号 (#) 组合成一个语法。句点 (.) 紧挨在井号 (#) 表达式之前。井号 (#) 可与“si”和“er”之间出现一次或更多次的任意字符相匹配。句点 (.) 用作单词 sicker 中字符“c”和“k”的通配符,以及单词 silkier 中“l”、“k”和“i”的通配符。

| [ ] | 字符集 用于匹配括号 ([ ]) 内的任意一个字符。可以使用连字符 (-) 指定字符的范围,例如 [a-z]。 例如:

  • 该正则表达式具备匹配 cat、cot 和 cut 的能力,但无法匹配cet或cit。
  • 该正则表达式对应任意一个数字,并且允许指定多个字母范围。
  • 该正则表达式对应所有大写和小写字母。
$ 行尾 定位于行尾匹配。 例如,正则表达式 professional$ 可匹配字符串“He is a professional”,但不能匹配字符串“They are a group of professionals”。
^^ 文件开头 定位于文件开头匹配。仅适用于在源代码或文本文件中搜索文本。 例如,若要匹配文件开头的第一个 HTML 标记,请使用此正则表达式:^^

| **文件末尾** 定位于文件末尾匹配。仅适用于在源代码或文本文件中搜索文本。 例如,若要匹配文件末尾的最后一个 HTML 标记(标记后没有空格),可使用此正则表达式:

|转义特殊字符 用于匹配反斜线 () 后面的字符。这样,就可以查找正则表达式语法中使用的字符(如左大括号 ({) 或脱字号 (^))或其他一些特殊字符。 例如,使用 $ 可匹配美元符号 ($) 字符,而不是执行用于“定位于行尾”的正则表达式。同样,使用 . 可匹配句号 (.) 字符,而不是像句号 (.) 正则表达式一样匹配任意一个字符。
{} 标记表达式 对与括号内表达式匹配的文本加标记。可以使用 \N 在“查找”表达式中匹配出现在另一处的标记文本或者将标记文本插入“替换”表达式。 例如,假设要查找连续出现两次的单词。若要搜索,请使用此表达式:{.#} \1 假设连续出现的单词由一个空格隔开,则需要在右大括号 (}) 与反斜线 () 之间添加一个空格。 在本例中,将井号 (#)、句号 (.) 和大括号 ({}) 组合成一个语法。在此表达式中,.# 表示任何连续的字符。因为这部分表达式位于大括号 ({}) 内,所以连续的字符将被加上标记,并被引用为 \1。此表达式将查找后跟空格以及字符与其完全相同的任意连续字符。
\N 第 N 个标记表达式 在“查找”表达式中,\N 匹配由第 N 个标记表达式指定的文本,其中 N 是 1 到 9 的数字。 在“替换”表达式中,\N 插入由第 N 个标记表达式匹配的文本,其中 N 是 1 到 9 之间的数字。\0 插入整个“查找”表达式指定的文本。 例如,假设要查找连续出现两次的单词,并使用一个单词替换它们。若要搜索,请使用此表达式:.#} \l 假设连续出现的单词由一个空格隔开,则需要在右大括号 (}) 与反斜线 () 之间添加一个空格。在本例中,将井号 (#)、句号 (.) 和大括号 ({}) 组合成一个语法。 若要替换,请使用下列表达式:\l \1 表示在查找字符串中的第一对大括号内找到的 内容。通过在替换操作中使用 \1,实际上是将连续出现两次的单词替换为一个单词。
( ) 组表达式 标记子表达式的开始和结束。 子表达式指括在 ( ) 中的正则表达式,例如表达式:(ha)+。在本例中,将加号 (+) 与括号 ( ) 组表达式组合成一个语法。子表达式是 (ha),因为它括在括号 ( ) 内。添加加号 (+) 后,该表达式可查找重复的字母对。加号 (+) 表示“ha”出现一次或更多次。 此表达式可匹配下列各项:“haha”和“hahaha”。
~x 防止匹配 当 x 出现在表达式中的此位置时会防止匹配。 例如,正则表达式 real~(ity) 可匹配“realty”和“really”中的“real”,但不能匹配“reality”中的“real”。
\n 换行符 用于匹配“代码”视图中的新行,或“设计”视图中的
。 语法 (\n) 是匹配所有换行符的简便方法。
\t 制表符 用于匹配单个制表符。 例如,如果要查找所有位于行首的制表符,可使用此正则表达式: ^\t+ 在本例中,将脱字号 (^)、加号 (+) 和制表符 (\t) 组合成一个语法。脱字号 (^) 位于单个制表符表达式之前,用于匹配位于行首的所有制表符。加号 (+) 表示匹配一个或多个制表符。
[^] 任何一个不属于该集合的字符 用于匹配不包含在脱字号 (^) 之后的字符集内的任何字符。 例如,若要匹配范围之外的任何字符,可使用脱字号 (^) 作为左括号后面的第一个字符。表达式 [^269A-Z] 匹配除 2、6、9 以及任何大写字母之外的所有字符。
n 重复表达式 用于匹配脱字号 (^) 之前出现 n 次的表达式。 例如,若 n 为 4,表达式 [0-9]^4 匹配任何 4 位数序列。在本例中,将字符集 ([ ]) 语法与重复 (^n) 语法组合,以展示正则表达式的更实用的方法。
:a 字母数字字符 用于匹配表达式 [a-zA-Z0-9]。 可以使用表达式 [a-zA-Z0-9] 匹配出现一次的字母(大写或小写)或数字。也称为“字母数字匹配项”。可使用简写表达式 :a 来代替 [a-zA-Z0-9]。
:b 空格 用于匹配代码或文本中的任何空格。 例如,若要匹配行首的单个空格字符,请使用此正则表达式:^:b
:c 字母字符 用于匹配表达式 [a-zA-Z]。使用此表达式时,可以匹配所有大写或小写字母。 可以使用简写表达式 :c 来代替所有 [a-zA-Z]。
:d 十进制数 用于匹配表达式 [0-9]。利用此表达式可以匹配任何数字。 例如,假设要在文本文件中查找美国的社会福利号。美国的社会福利号的格式为 999-99-9999。:d3-:d2-:d^4 或 [0-9]3-[0-9]2-[0-9]^4(使用 [0-9] 表示)可返回相同的结果。 可使用简写表达式 :d 来代替所有 [0-9]。
:h 十六进制数 用于匹配表达式 [0-9a-fA-F]+ 使用此表达式可匹配由“A”和“F”之间的大写或小写字母和任意数字组成的十六进制数。 例如,假设网站中的网页使用了多种不同的背景色,而您要将这些网页的颜色改为黑色(即 000000)。但是,您不知道现有颜色的十六进制值。使用此正则表达式可查找所有的现有十六进制值: #:h 可以使用 [0-9a-fA-F] 进行搜索,但在本例中,将反斜线 ()、井号 (#) 和十六进制数字 (:h) 语法组合在一起。# 匹配非表达式的井号 (#),而 :h 匹配任何十六进制字符序列。 若要替换现有十六进制数值,可键入所需背景颜色的十六进制数值: 000000
:i 标识符 用于匹配表达式 [a-zA-Z_][a-zA-Z0-9_]* 处理代码时,如果需要匹配所有程序标识符,可使用简写表达式 :i,而无需键入上述冗长的表达式。
:n 有理数 用于匹配表达式 ([0-9]+.[0-9]*) ([0-9]*.[0-9]+) ([0-9]+) 如果需要匹配带小数点的整个数值,可使用简写表达式 :n,而无需键入上述冗长的表达式。
:q 带引号的字符串 用于匹配表达式 ("[~"]*") ('[~']*') 如果需要匹配加引号的所有引号,可使用简写表达式 :q,而无需键入上述冗长的表达式。
:w 字母字符串 用于匹配表达式 [a-zA-Z]+ 此语法是一种可匹配一个或多个大写或小写字母字符的简便方法。
:z 整数 用于匹配表达式 [0-9]+ 此语法是一种可匹配任何整数的简便方法。

转载于:https://my.oschina.net/HJCui/blog/639310

全部评论 (0)

还没有任何评论哟~