|

楼主 |
发表于 2007-7-13 14:33:00
|
显示全部楼层
还剩下最后一步
好了,我现在已经完成了大半。只剩下最后一步了。
#!/bin/bash
##########################################################################################################################################################################从www.pass-e.com中提取有效数 ... ###################
################################################################################
############从www.pass-e.com下载源代码### ... ###################
wget -c htt p://www.pass-e .com/proxy/inde x.php?page=1
wget -c htt p:// www.p ass-e.co m/proxy/inde x.php?page=2
##wget -c h tp://www. pass-e.com/proxy/i ndex.php?page=3
##wget -c htt p ://ww w.pass-e.com/proxy/ind ex.php?page=4
################################################################################
###########从源代码中提取代理原始数据到proxyDB.tmp1#############################################################################################################
grep '^list(' index.php\?page\=1 >proxyDB.tmp1
grep '^list(' index.php\?page\=2 >>proxyDB.tmp1
##grep '^list(' index.php\?page\=3 >>proxyDB1.tmp1
##grep '^list(' index.php\?page\=4 >>proxyDB1.tmp1
################################################################################
###########删除源代码###########################################################################################################################################
rm index.php\?page\=1
rm index.php\?page\=2
##rm index.php\?page\=3
##rm index.php\?page\=4
################################################################################
##############转换成标准的utf8编码##############################################################################################################################
iconv -c -f gb2312 -t utf8 proxyDB.tmp1 -o proxyDB.tmp2
rm proxyDB.tmp1
################################################################################
#############提取代理IP数据到proxyDB.tmp3#######################################################################################################################
awk -F"'" '{ print $2"\t"$4"\t"$6"\t"$8 }' proxyDB.tmp2 > proxyDB.tmp3
rm proxyDB.tmp2
awk -F "\t" '{ if (gsub("1","匿名",$3)) print $0 }' proxyDB.tmp3 >proxyDB.tmp4
awk -F "\t" '{ if (gsub("2","透明",$3)) print $0 }' proxyDB.tmp3 >>proxyDB.tmp4
awk -F "\t" '{ if (gsub("3","高匿",$3)) print $0 }' proxyDB.tmp3 >>proxyDB.tmp4
em proxyDB.tmp3
awk '{ print $1"\t"$2"\t"$3"\t"$4 }' proxyDB.tmp4 >proxyDB.dat
rm proxyDB.tmp4
################################################################################
############制作proxyIP.dat#####################################################################################################################################
awk -F"\t" '{ print $1 }' proxyDB.dat >proxyIP.dat
好了,就到了这一步就写不下去了。我的本来是想在最后一句
awk -F"\t" '{ print $1 }' proxyDB.dat >proxyIP.dat的中间print $1 后面加上一个ping -c10 $1 |grep
rtt |awk -F "/" '{ print $5}'
可是怎么都加不上去。做到这里花费了我好几个小时。哪位高手帮忙把它补全吧。
多谢了。 |
|