设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 702|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔3 ~  c- F& j( o% N

8 h8 F% K( b- A偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!$ s; [. S- U) ~. ~

/ U: t- u: ^1 h* c" _7 J( Q先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了3 A$ w- N  \4 R# B: Z
! u, E/ c; \, F$ @  q1 \6 |
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。0 k/ Q5 r" M$ i& f- G

+ u9 R6 w4 Q4 m* M: ~- Y$ bRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:+ m- v7 \5 J$ J5 X5 V, ?
8 _' [+ x6 j* U# [  E
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
4 ]- _2 E  n0 v8 _3 t: o; H, G. x& [0 u, k
就是说,Robot报告的东西就是Google能查到的。+ f, b0 N" ], @, U# |9 W
# k0 Y# o. U; S2 D/ W
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。7 C' T- W& V0 x

0 o& S+ K- N0 k5 Z废话说了介么多,好啦好啦,进入主题!怎么做?
4 I8 n9 l9 k4 T9 j* D
$ T! {6 z3 \8 D7 B真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵3 G3 y/ j8 e3 p0 p3 r+ @
6 b% z# N$ y/ x- ^1 I$ i/ B
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说3 [! R8 L* O8 o

" n) Y# N: l+ _9 P1 R/ x+ x把下面两行贴进去,当然你要一个字一个字打偶也不反对
* J: @5 ~! b7 a7 r  |, Z
5 m- x) O0 ]2 N6 f4 JUser-agent: *6 B1 ]$ m- |  i8 q4 m4 B8 n% J
Disallow: /) ^; z$ l& z& H) l
" _# S% t/ e% n$ ^! G/ @0 X& s! Z
保存,然后丢进你的网站http根目录里。
( h/ C! S4 g" \: B  u1 v& N: N; ]7 L( H
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
  P( n  l0 V$ H; J4 B' t2 y- |: z6 ^- K. H6 s! c, Z
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题/ ^! b5 [9 t% m! D2 F/ M

, n; H: e" U) L/ Z7 P1 hUser-agent: *
/ E  K, a& n: p+ [7 B1 y+ c' YDisallow: /bbs
$ b9 q% C/ `# ]
. i) b1 O/ _/ X: M) @2 b) r7 n3 i0 H可以了!
3 q8 b7 I. n* g5 `2 A% Z; K) k* u
再来个例子:
9 ]9 {. O2 z" o% i. i- o& @5 a+ @3 d- }) a
User-agent: *% I: o# X/ `5 Y9 H
Disallow: /pub: L  s9 m+ ?, @( X9 ^# Z
Disallow: /img( K+ @# j6 T2 H# @4 L3 p
Disallow: /cgi-bin+ k7 l1 B& e8 A; k; j$ V+ ?8 O! P2 x
Disallow: /forum# e6 E: R6 O  {/ G, F1 R
Disallow: /shop
# q9 l$ z  t, Z- W+ ]8 @" R
: \* D9 T8 t5 ^4 h8 l- F0 k8 C  b/ s! @看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~# n6 g& {9 \/ F' ~9 F5 q* @

' c9 I4 N1 K4 F! U0 x最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔1 V& i3 e* R3 W# i

5 q. d6 E% [+ p" ?* V. rps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔( H3 l" h0 X8 I
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
! E! k6 Q1 O3 N9 H+ N2 H2 g: U( `0 p
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表