LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 2084|回复: 10

如何将每一行含有特定字符的域提取出来?[已解决]

[复制链接]
发表于 2004-2-6 11:38:09 | 显示全部楼层 |阅读模式
如何将每一行含有特定字符的域提取出来?

例如
abc linux 897 dk 6 dif7
china ok li3 id9
mail biao lovie linux won


处理后应为:
linux
linux
发表于 2004-2-6 11:42:25 | 显示全部楼层
你能举一下实例吗?我个人觉得这么提出来没有任何意义。因为根据你的例子这么提取"linux",我还不如自己建一个有N行"linux"的文件来得方便,想建多少行就建多少行。
 楼主| 发表于 2004-2-6 11:46:54 | 显示全部楼层
我想把网页中的连接地址提取出来,接下来可以用wget下载,省去手动的麻烦
发表于 2004-2-6 12:19:13 | 显示全部楼层
用正则表达式,搜索一下本版,我记得以前有这样的贴子!
 楼主| 发表于 2004-2-6 12:25:28 | 显示全部楼层
要是搜索得到也不用发贴了:(

我想和正则表达式没有太大关系吧,关键是象grep,sed,awk好象都做不到找出特定域并打印出来,awk好象也只能做到对特定域应用正则表达式。
发表于 2004-2-6 12:31:29 | 显示全部楼层
贴出个样本出来吧~,我想有grep,awk,sed足已胜任,要不也可以用perl.
 楼主| 发表于 2004-2-6 12:45:49 | 显示全部楼层

谢谢啦

1990年全国赛对局选-109局 <http://www.w88.org/xiangqi/1990dj109.rar>
1990年全国个人赛专集365局 <http://www.w88.org/xiangqi/1990zj365.rar>
1986年全国团体赛对局赛 <http://www.w88.org/xiangqi/1986ttdj.rar>
1986年全国个人赛对局选 <http://www.w88.org/xiangqi/1986qggr.rar> 1984年
全国象棋团体赛 <http://www.w88.org/xiangqi/1984qgtt.rar>
第二十一届五羊杯象棋赛 <http://www.w88.org/xiangqi/21wyb.rar> 第二十届五
羊杯象棋赛 <http://www.w88.org/xiangqi/20wyb.rar>
第十九届五羊杯象棋赛 <http://www.w88.org/xiangqi/19wyb.rar> 第十八届五羊
杯象棋赛 <http://www.w88.org/xiangqi/18wyb.rar>
第十七届五羊杯象棋赛 <http://www.w88.org/xiangqi/17wyb.rar> 第十六届五羊
杯象棋赛 <http://www.w88.org/xiangqi/16wyb.rar>
第十五届五羊杯象棋赛 <http://www.w88.org/xiangqi/15wyb.rar> 少林汽车杯象
棋赛 <http://www.w88.org/xiangqi/slqcb.rar>
银荔杯对局集萃 <http://www.w88.org/xiangqi/ylbdj.rar> 世界象棋赛
<http://www.w88.org/xiangqi/sjxq.rar>
南北象棋对抗赛 <http://www.w88.org/xiangqi/nbxqdk.rar> 1999红牛快棋赛
<http://www.w88.org/xiangqi/1999hn.rar>
1999怪坡杯象棋赛 <http://www.w88.org/xiangqi/1999gp.rar> 第十四届五羊杯
象棋赛 <http://www.w88.org/xiangqi/14wyb.rar>
第十三届五羊杯象棋赛 <http://www.w88.org/xiangqi/13wyb.rar> 第十二届五羊
杯象棋赛 <http://www.w88.org/xiangqi/12wyb.rar>
                                                                                                                           
第十一届五羊杯象棋赛 <http://www.w88.org/xiangqi/11wyb.rar> 第十届五羊杯
象棋赛 <http://www.w88.org/xiangqi/10wyb.rar> 第九届五羊杯象棋赛
<http://www.w88.org/xiangqi/09wyb.rar> 第八届五羊杯象棋赛
<http://www.w88.org/xiangqi/08wyb.rar>
第七届五羊杯象棋赛 <http://www.w88.org/xiangqi/07wyb.rar> 第六届五羊杯象
棋赛 <http://www.w88.org/xiangqi/06wyb.rar> 第五届五羊杯象棋赛
                                                                                                          38,1         顶端
发表于 2004-2-6 12:59:57 | 显示全部楼层
具体情况具体分析,根据你的文本可以这样:
  1. tr ' ' '\n' <wwwfile|grep ^\<|tr -d '<'|tr -d '>'
复制代码
 楼主| 发表于 2004-2-6 14:50:01 | 显示全部楼层
茅塞顿开,谢谢!
发表于 2004-2-6 22:51:18 | 显示全部楼层
在perl版已经有了另外一个答案
http://www.linuxsir.cn/bbs/showthread.php?threadid=88310
用sed的方法,
  1. sed 's/.*\(<http.*rar>\).*/\1/g;s/<//g;s/>//g' wwwfile
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表