正则表达式元字符:

^
#锚定行的开始。如:/^sed/匹配所有以sed开头的行。

$
#锚定行的结束。如:/sed$/匹配所有以sed结尾的行。

.
#匹配一个非换行字符。如:/s..d/匹配s后接任意两个个字符,最后是d。

*
#匹配零个或多个字符。如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。

[]
#匹配一个指定范围内的字符。如/[Ss]ed/匹配Sed和sed。

[x-y]
#匹配指定范围内的一个字符。如/[a-z]ed/匹配一个a-z之间任意字符后跟ed的行。

[^]
#匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。

\
#用来转义字符。如:/sed\./匹配包含sed后面跟一个句点.(未经转义的句点通常匹配单个字符)

\<
#词首定位符。如:/\<love/匹配包含以love开头的单词的行。

\>
#词尾定位符。如/love\>/匹配包含以love结尾的单词的行。

\(..\)
#匹配稍后将要使用的字符的标签。如s/\(love\)able/\1rs,loveable被替换成lovers。
#最多可以使用9个标签,模式中最左边的标签是第1个。用\1表示。

x\{m\}
#重复字符x,m次,如:/0\{5\}/匹配包含5个o的行。

x\{m,\}
#重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的行。

x\{m,n\}
#重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的行。

&
#保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。


Postfix方括号字符集:

[:alnum:]#数字字符	
	
[:lower:]#小写字母字符

[:alpha:]#字母字符	
	
[:print:]#可显示的字符

[:blank:]#空格(space)与定位符(tab)字符	
	
[:punct:]#标点符号字符

[:cntrl:]#控制字符		

[:space:]#空白(whitespace)字符

[:digit:]#数字字符		

[:upper:]#大写字母字符

[:graph:]#非空格字符		

[:xdigit]#十六进制数字


Sed学习:

1.sed选项:

-ecommand,--expression=command#允许多项编辑。

-f,--filer=script-file#指定sed脚本文件名。

-n,--quiet,--silent#取消默认的输出。

-V,--version#打印版本和版权信息。

-h--help	#打印帮助。


2.sed命令:

a\	#在当前行后添加一行或多行

c\	#用新文本修改(替换)当前行中的文本

d	#删除行

i\	#在当前行之前插入文本

h	#把模式空间里面的内容复制到暂缓冲区

H	#把模式空间里面的内容追加到暂缓冲区

g	#取出暂存缓冲区的内容,将其复制到模式空间,覆盖该处原有内容。

G	#取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面。

l	#列出非打印字符。

p	#打印行。

n	#读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理。

q	#结束或退出sed。

r	#从文件中读取输入行。

!	#对所选行以外的所有行应用命令。

s	#用一个字符串替换另一个。


3.sed替换标志:

g	#在行内进行全局替换。

p	#打印行。

w	#将行写入文件。

x	#交换暂存缓冲区与模式空间的内容。

y	#将字符转换为另一字符(不能对正则表达式使用y命令)


sed示例:

[root@localhostmnt]#catexample.txt
onelinetext
twolinetext
threelinetext
fourlinetext
fivelinetext
endline!!!


删除:d命令:

1.#删除文件中的第二行

[root@localhostmnt]#sed'2d'example.txt
onelinetext
threelinetext
fourlinetext
fivelinetext
endline!!!

2.#删除文件中的最后一行

[root@localhostmnt]#sed'$d'example.txt
onelinetext
twolinetext
threelinetext
fourlinetext
fivelinetext

3.#删除第三行到末尾所有行

[root@localhostmnt]#sed'3,$d'example.txt
onelinetext
twolinetext

4.#删除文件中包含text的行

[root@localhostmnt]#sed'/text/'dexample.txt
endline!!!


替换:s命令:

1.#在整行范围内把e替换为E。如果没有g标记,则每行只匹配第一个e。

[root@localhostmnt]#sed's/e/E/g'example.txt
onElinEtExt
twolinEtExt
thrEElinEtExt
fourlinEtExt
fivElinEtExt
EndlinE!!!

2.#(-n)选项和p标志一起使用表示只打印那些发生替换的行。

[root@localhostmnt]#sed-n's/d/D/p'example.txt
enDline!!!

3.#&符号表示替换换字符串中被找到的部份。

[root@localhostmnt]#sed-n's/^end/&for/p'example.txt
endforline!!!#这里&替换成为end

4.#on标记为1,所有的one都会被替换为oncoming!

[root@localhostmnt]#sed-n's/\(on\)e/\1coming/p'example.txt
oncominglinetext

5.#不论什么字符,紧跟着s命令的都被认为是新的分隔符,所以这里的#是分隔符;

[root@localhostmnt]#sed-n's#one#Haha#p'example.txt
Hahalinetext

选定行的范围:逗号

1.#所有在模板th和f所确定的范围内的行都被打印。

[root@localhostmnt]#sed-n'/th/,/f/p'example.txt
threelinetext
fourlinetext

2.#打印从第二行到第一个包含以four开始的行之间的所有行。

[root@localhostmnt]#sed-n'2,/^four/p'example.txt
twolinetext
threelinetext
fourlinetext

3.#对于模板one和three之间的行,每行的行首添加字符串Ceshi。

[root@localhostmnt]#sed'/one/,/three/s/^/Ceshi/'example.txt
Ceshionelinetext
Ceshitwolinetext
Ceshithreelinetext
fourlinetext
fivelinetext
endline!!!

多点编辑:e命令

1.#(e)选项允许在同一行里执行多条命令。

[root@localhostmnt]#sed-e'1,3d'-e's/five/FFFF/'example.txt
fourlinetext
FFFFlinetext
endline!!!

2.#一个比-e更好的命令是--expression。它能给sed表达式赋值。

[root@localhostmnt]#sed--expression='s/one/ONE/'--expression='/h/d'example.txt
ONElinetext
twolinetext
fourlinetext
fivelinetext
endline!!!

从文件读入:r命令

1.#hosts文件内容被读进来,显示在与one匹配的行后面。
#如果匹配了多行,那么hosts内容将显示在所有的匹配行下面。

[root@localhostmnt]#sed'/one/r/etc/hosts'example.txt
onelinetext
127.0.0.1localhostlocalhost.localdomainlocalhost4localhost4.localdomain4
::1localhostlocalhost.localdomainlocalhost6localhost6.localdomain6
twolinetext
threelinetext
fourlinetext
fivelinetext
endline!!!

写入文件:w命令

1.#example中所有包含f的行都被写入到write.txt中。

[root@localhostmnt]#sed-n'/f/wwrite.txt'example.txt
[root@localhostmnt]#catwrite.txt
fourlinetext
fivelinetext

追加命令:a命令

1.#“----->thisisatest”被追加到匹配three的行后面,sed要求命令a后面有一个反斜杠。

[root@localhostmnt]#sed'/three/a\----->thisisatest'example.txt
onelinetext
twolinetext
threelinetext
----->thisisatest
fourlinetext
fivelinetext
endline!!!

插入:i命令

1.#“----->thisisanewline”被插入到匹配three的行前面,sed要求命令i后面有一个反斜杠。

[root@localhostmnt]#sed'/three/i\----->thisisanewline'example.txt
onelinetext
twolinetext
----->thisisanewline
threelinetext
fourlinetext
fivelinetext
endline!!!

下一个:n命令

1.#如果three被匹配,则移动到匹配行的下一行,替换这一行的line为LINE,并打印且继续。

[root@localhostmnt]#sed'/three/{n;s/line/LINE/;}'example.txt
onelinetext
twolinetext
threelinetext
fourLINEtext
fivelinetext
endline!!!

变形:y命令

1.#把1-3行内所有匹配line任意字母的字符转变为大写。注意:正则表达式元字符不能使用这个命令。

[root@localhostmnt]#sed'1,3y/line/LINE/'example.txt
oNELINEtExt
twoLINEtExt
thrEELINEtExt
fourlinetext
fivelinetext
endline!!!

退出:q命令

1.#打印第三行后退出sed。

[root@localhostmnt]#sed'3q'example.txt
onelinetext
twolinetext
threelinetext

保持和获取:h命令和G命令

1.#在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,
#除非行被删除或者输出被取消,否则所有被处理的行都将打印在屏幕上。
#接着模式空间被清空,并存入新的一行等待处理。
#这里,匹配two的行存入模式空间,h命令将其复制并存入一个称为保持缓存区的特殊缓冲区内。
#第二条语句是当达到最后一行后,G命令取出保持缓冲区的行。

[root@localhostmnt]#sed-e'/two/h'-e'$G'example.txt
onelinetext
twolinetext
threelinetext
fourlinetext
fivelinetext
endline!!!
twolinetext

保持和互换:h命令和x命令

1.#互换模式空间和保持缓冲区的内容。由结果可以得出匹配three的行将被two替换。

[root@localhostmnt]#sed-e'/two/h'-e'/three/x'example.txt
onelinetext
twolinetext
twolinetext
fourlinetext
fivelinetext
endline!!!


AWK学习:


使用方法:

awk'{pattern+action}'{filenames}


AWK内置变量:

ARGC#命令行参数个数

ARGV#命令行参数排列

ENVIRON#支持队列中系统环境变量的使用

FILENAME#awk浏览的文件名

FNR#浏览文件的记录数

FS#设置输入域分隔符,等价于命令行-F选项

NF#浏览记录的域的个数

NR#已经读出的记录数,就是行号,从1开始,如果有多个文件话,这个值也是不断累加中。

OFS#输出字段分隔符,默认也是空格

ORS#输出的记录分隔符,默认为换行符

RS#输入的记录分隔符,默认为换行符

此外,$0变量是指整条记录。$1表示当前行的第一个域,$2表示当前行的第二个域,......以此类推

AWK入门指南http://awk.readthedocs.org/en/latest/chapter-one.html

正则表达式、sed、awk相关资料笔记资料整合的更多相关文章

  1. Html5 canvas实现粒子时钟的示例代码

    这篇文章主要介绍了Html5 canvas实现粒子时钟的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

  2. HTML5数字输入仅接受整数的实现代码

    这篇文章主要介绍了HTML5数字输入仅接受整数的实现代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  3. ios – 使用大写符号在字符串swift中获取URL的正则表达式

    我尝试在文本中获取URL.所以,在此之前,我使用了这样一个表达式:但是当用户输入带有大写符号的URL时(例如Http://Google.com,它与它不匹配)我遇到了问题.我试过了:但什么都没发生.解决方法您可以使用正则表达式中的i内联标志关闭区分大小写,有关可用正则表达式功能的详细信息,请参阅FoundationFrameworkReference.(?ismwx-ismwx)Flagsetti

  4. 在Xcode4中,你可以更改用于显示隐形字符的字符吗?

    我更喜欢VisualStudio显示隐形的方式……

  5. ios – 应用程序商店描述特殊字符

    是不是可以在AppStore描述中使用像星星这样的特殊字符了?我得到这个错误:描述不得包含标记语言.说明不得包含以下字符:★提前致谢:)解决方法仍然允许一些unicode字符.以下字符已经过测试并仍然有效:◆√至于现在他们工作正常,但苹果可以随时再次改变条件.

  6. ios – 将数组中的字符转换为整数

    即使我搜索了文档,我似乎无法弄清楚如何做到这一点.我试图弄清楚如何将数组中索引处的字符转换为整数.例如,假设我有一个名为“容器”的字符数组,我无法弄清楚该怎么做:谢谢您的帮助!解决方法Swift并不容易在原始和类型表示之间进行转换.这是一个在此期间应该有所帮助的扩展:这使您可以非常接近您想要的:对于遇到此问题的任何工程师,请参阅rdar://17494834

  7. ios – 如何在Swift 3中使用正则表达式?

    解决方法我相信.当没有其他选项适用时,将使用.allZeros.因此,使用Swift3,您可以传递一个空的选项列表或省略options参数,因为它默认为无选项:要么请注意,在Swift3中,您不再使用error参数.它现在抛出.

  8. ios – lldb断点在类目标c中的所有方法

    如何使用lldb在ObjectiveC类中的所有方法上自动设置断点?

  9. ios – 创建一个包含n个空格或其他重复字符的字符串

    我想使用Swift使用n个空格进行字符串,但不使用for循环或手动如下所示:解决方法String已经有一个repeating:count:initializer就像Array(和其他采用RangeReplaceableIndexable协议的集合):所以你可以打电话:请注意,重复的参数是一个字符串,而不仅仅是一个字符,因此您可以重复整个序列:编辑:更改为Swift3语法,并删除了关于Swift1类

  10. ios – 如何使用Unicode十六进制值(UTF-16)在Swift中表达字符串

    我想在Swift中使用十六进制值编写一个Unicode字符串.我已经阅读了字符串和字符的documentation,所以我知道我可以使用特殊的Unicode字符直接在字符串如下:版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

随机推荐

  1. 法国电话号码的正则表达式

    我正在尝试实施一个正则表达式,允许我检查一个号码是否是一个有效的法国电话号码.一定是这样的:要么:这是我实施的但是错了……

  2. 正则表达式 – perl分裂奇怪的行为

    PSperl是5.18.0问题是量词*允许零空间,你必须使用,这意味着1或更多.请注意,F和O之间的空间正好为零.

  3. 正则表达式 – 正则表达式大于和小于

    我想匹配以下任何一个字符:或=或=.这个似乎不起作用:[/]试试这个:它匹配可选地后跟=,或者只是=自身.

  4. 如何使用正则表达式用空格替换字符之间的短划线

    我想用正则表达式替换出现在带空格的字母之间的短划线.例如,用abcd替换ab-cd以下匹配字符–字符序列,但也替换字符[即ab-cd导致d,而不是abcd,因为我希望]我如何适应以上只能取代–部分?

  5. 正则表达式 – /bb | [^ b] {2} /它是如何工作的?

    有人可以解释一下吗?我在t-shirt上看到了这个:它似乎在说:“成为或不成为”怎么样?我好像没找到’e’?

  6. 正则表达式 – 在Scala中验证电子邮件一行

    在我的代码中添加简单的电子邮件验证,我创建了以下函数:这将传递像bob@testmymail.com这样的电子邮件和bobtestmymail.com之类的失败邮件,但是带有空格字符的邮件会漏掉,就像bob@testmymail也会返回true.我可能在这里很傻……当我测试你的正则表达式并且它正在捕捉简单的电子邮件时,我检查了你的代码并看到你正在使用findFirstIn.我相信这是你的问题.findFirstIn将跳转所有空格,直到它匹配字符串中任何位置的某个序列.我相信在你的情况下,最好使用unapp

  7. 正则表达式对小字符串的暴力

    在测试小字符串时,使用正则表达式会带来性能上的好处,还是会强制它们更快?不会通过检查给定字符串的字符是否在指定范围内比使用正则表达式更快来强制它们吗?

  8. 正则表达式 – 为什么`stoutest`不是有效的正则表达式?

    isthedelimiter,thenthematch-only-onceruleof?PATTERN?

  9. 正则表达式 – 替换..与.在R

    我怎样才能替换..我尝试过类似的东西:但它并不像我希望的那样有效.尝试添加fixed=T.

  10. 正则表达式 – 如何在字符串中的特定位置添加字符?

    我正在使用记事本,并希望使用正则表达式替换在字符串中的特定位置插入一个字符.例如,在每行的第6位插入一个逗号是什么意思?如果要在第六个字符后添加字符,请使用搜索和更换从技术上讲,这将用MatchGroup1替换每行的前6个字符,后跟逗号.

返回
顶部