LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: Snoopy

[超级难题]如何复制它?[未解决]

[复制链接]
发表于 2004-4-17 12:10:15 | 显示全部楼层
最初由 folklore 发表
请见以下代码:
<body leftmargin="0" topmargin="0" onselectstart="return false" oncontextmenu="self.event.returnValue=false;" onmousemove="if(event.ctrlKey) document.all.aaaa.focus()">


onselectstart=return false"
怎么可以是false,当然要remove it了
最好抒其它的也remove了,设文件中使用了javascript代码不让你copy,你也可以设你的游览器禁用javascript就ok了

呵呵,使过了,还是不OK
发表于 2004-4-17 12:15:28 | 显示全部楼层
发表于 2004-4-17 13:03:11 | 显示全部楼层
最初由 georgek 发表
有點像這個
http://www.linuxsir.cn/forum.php?mod=viewthread&tid=102114

烦老georgek版主用perl来解决解决吧 ;)
发表于 2004-4-17 13:20:53 | 显示全部楼层
先試試看:p
发表于 2004-4-17 16:05:51 | 显示全部楼层
最初由 javalee 发表
是可以复制,但是这样的文本怎么看呀? 结果:

其实找到他们每行出现的规律,可惜,
发表于 2004-4-17 16:06:24 | 显示全部楼层
應該快完成的, 但我可能到明晚才有時間繼續~~ :p
有興趣的兄弟看看有沒有幫助 :p
test2.html 是那些編排過的內文(table)

  1. #!/bin/perl

  2. open( INFILE, "test2.html" ) || die "Can not open file!\n";

  3. $line = <INFILE>;

  4. close( INFILE);

  5. $line =~ s/<table.*?>/<table>/g;

  6. $line =~ s/<td.*?>/<td>/g;

  7. $line =~ s/<br>/\n/g;

  8. @list=split/<table>/,$line;

  9. foreach $line2(@list)

  10. {

  11. $line2 =~ s/(<tr>|<\/td>|<\/tr>|<\/table>)//g;

  12. @line3 =split/<td>/,$line2;

  13. $i=0;

  14. foreach $line4(@line3)

  15. {

  16.         $i++;

  17.         @line5=split/\n/$line4

  18. }

  19. for ( j=1 to $i ) {

  20.         print $line5{$j}

  21. }

  22. }
复制代码
发表于 2004-4-17 16:07:49 | 显示全部楼层
分析每两个table标签包裹的内容中的br标签的先后顺序即可,可以利用gawk的关联数组。


可惜我还未装好Debian,要不我应该写出来了。
发表于 2004-4-17 16:13:43 | 显示全部楼层
<table width=18% border=0 cellpadding=0 cellspacing=0> <tr><td nowrap class='content'> 提及Linux这个话题,W<br>永远解不开的“冤家”。其<br>统,它们的地位是同等
。<br>阶段,Linux的发展,必须<br>容。 <br></td><td nowrap class='content'>indows总是会被卷入进来。这给<br>实不然,单纯从技术上来讲,Wi<br>Windows作为一类操作系统产品<br>做好与各类软硬件甚至包括Wind<br><br></td><td nowrap class='content'>人们一种错觉,Linux和Windows是<br>ndows和Linux是两种不同的操作系<br>体系,它已经发展得相当成熟。现<br>ows在内的各种操作系统平台的兼<br><br></td> </tr></table>

我姑且分析一下。
其实很简单,每段都是分栏组合的。在每两个<td></td>标签之间有若干个<br>,它们按顺序地包裹了原本每一行的片断。
"提及Linux这个话题,W<br>",就对应了"indows总是会被卷入进来。这给<br>""人们一种错觉,Linux和Windows是<br>"
这样组合起来,就变成了"提及Linux这个话题,Windows总是会被卷入进来。这给人们一种错觉,Linux和Windows是"
很简单啊~~~
发表于 2004-4-17 16:17:03 | 显示全部楼层
努力吧兄弟们!
发表于 2004-4-17 16:39:42 | 显示全部楼层
最初由 javalee 发表
努力吧兄弟们!

javalee兄何以将其称为"超级难题"呢,呵呵~~
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表