设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 635|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
4 J) x0 t4 L4 O
$ i! x. q( X/ p偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!3 _  l+ |! {0 {* m1 @
- b2 H# O4 ^4 o. S2 W- r& H
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了  A$ p9 Y2 F7 C4 x; ~9 j

4 B% ?- J) b9 @! S( s& r3 o) q+ _% ?网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
- k* I1 U, w+ n/ H0 f
5 z4 Y0 K6 m8 |9 eRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
- f. C& @0 C! P4 a7 _; Z! r% X- |7 j# _# A% c
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)". N' _+ k$ Y0 R4 }! s

9 w9 B+ }9 h/ M6 o就是说,Robot报告的东西就是Google能查到的。
/ R  U8 ^: B3 o  {) U: i( v0 ]+ G$ n3 s- q
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
8 H, @8 L; e& \, f& n  C* ]
5 f) w6 q" M+ A! ?. v' a废话说了介么多,好啦好啦,进入主题!怎么做?
$ [& n8 N: V" q8 {; _  ^
  p5 j2 ^0 z5 |/ _3 B真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
% v! A8 s3 [4 G7 D( U: z
- g, L. f* v: I+ x. R, K. p首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
7 ~0 d+ X9 q  x7 |+ Q, E9 V+ t: v8 Q9 w' Q
把下面两行贴进去,当然你要一个字一个字打偶也不反对
0 z3 I+ _' H& B( }3 A, j  z1 c% e
8 I5 U. p" i' H' m0 T: }User-agent: *
. T# \8 q4 K8 V( a" SDisallow: /
3 w, V3 f' ~1 t  p% w+ |% k
: d$ v2 G' R: q1 K8 J9 T保存,然后丢进你的网站http根目录里。% \+ i6 T0 ?* `) q6 p- N% [- z
3 G8 j: g: ?: ^6 W
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了  `3 y% t! G( F- B
2 ~' b5 h) A4 l! E% h
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题- ~0 _; n% _8 k7 ?# h
: X+ s, _9 B, U, m
User-agent: *
9 b7 t; H& G$ u4 `' L7 b, HDisallow: /bbs# F( `1 W) Z4 k; a

/ p! O) C* h! z7 s# D可以了!, L2 C, H- o/ @7 E' B
- Y7 R( z' s+ x: u- S
再来个例子:0 n& d& {" @) `1 y6 o
' \8 h, _$ K! R! u- M. F
User-agent: *! p1 d1 I4 O9 C! {
Disallow: /pub
" M: U& A! P' j) i* [" wDisallow: /img
: L! U8 P$ i/ TDisallow: /cgi-bin3 ^% P! z4 ]& C. B" q+ k/ y% H
Disallow: /forum5 q3 v. p9 V) {8 N
Disallow: /shop
! ~# ]1 q: }% s4 q# z4 S
) D; @" c& Z7 t: s/ o看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
2 b  S9 ]7 [! j5 a8 |9 `0 H4 U% t8 g
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔' z3 ]' C3 D! j( v2 C% j# Z

! Y  j2 U! s8 C% ]. \/ tps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔: [- f5 ~. @1 g
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
! l' W8 W& K, t% F1 b
9 B/ h& g5 |8 U. ^6 i; B[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表