设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 672|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔2 W0 Y9 w& }$ b$ p. ]
& q, d- w5 o: _4 ~% c* g& h
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
" v0 h  \3 }! X; T. p3 w% D7 G3 t' j' U  d
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了; S# e$ R: D' f# i! Y, V
2 y  j% B7 @4 X9 {8 z- u% x3 v, {) a; H
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。) B. w3 C1 V) h1 [( W* F7 x

* r' }5 x. U! k$ BRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:8 I! J" n' V& r+ n4 v/ ]
- a# ^9 U) j( l  ]; N8 y7 M. C) o
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"5 P  t! {7 i+ r' N+ H3 A' `
) `# E2 ~- c% u
就是说,Robot报告的东西就是Google能查到的。
1 }0 {: k2 p7 O0 [
9 y  e$ n& t/ g此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。0 J: X) w/ J/ V0 |! O1 J

1 m! g+ O. `7 y: [) u废话说了介么多,好啦好啦,进入主题!怎么做?
: N, F; g. w# z" Y
% o% P* K# _! e- E4 \真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
+ o" l; Z5 x  `
' `+ G) k2 }3 x- [9 s  Y8 N5 a/ W首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
# j' }. r# s2 Q! P! a$ T2 i& A7 V, s. m" M0 X, e/ c
把下面两行贴进去,当然你要一个字一个字打偶也不反对2 L6 S  P+ X1 S- x

' S4 O% _( a& ?! T5 n' \+ L% DUser-agent: *. S: D6 v3 Z1 w
Disallow: /  s$ @  v4 R  i" Y

) G: W' e5 H/ ^/ @2 k! n6 e& n保存,然后丢进你的网站http根目录里。7 v5 Z; |! \/ W$ b$ @

' E3 ~: ?4 q' p8 k+ x1 Q0 r完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
; m; H1 e7 u4 Y* K1 B0 v, z, T
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题: U- ]- G6 n0 U! R
/ w) d# ]0 i1 a' ~9 t$ i
User-agent: *
2 y. f+ O0 J/ L- a! E' ?Disallow: /bbs
# O( I' I& v  ?% c+ y  {& e% a' S. A! R4 F0 @4 h0 i
可以了!; n+ m, k+ e8 ^& k
: N/ p, q' p. j2 S' \
再来个例子:
& z( g2 B( f" k
; ]' L- `' @$ F* G* \! ^2 V/ V& {6 @User-agent: *
5 J! |5 d' Y& ^+ |- nDisallow: /pub% C1 X$ L6 |( V- m: @
Disallow: /img. h: T- D5 |: m. Q9 C$ z
Disallow: /cgi-bin
2 ~$ F4 G$ a. {* z4 ]. LDisallow: /forum
8 M1 n- I1 C& r# W# R7 FDisallow: /shop
( h0 ~0 y2 _/ A+ p/ e" ?8 X& L# i' E: F. j" r/ f  s
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~! t3 R  C+ F8 F3 E9 Q$ V( j: z

8 z; g' x' V  M最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔; d) m6 K- z% `
! N0 Y! C+ V. P* m$ j
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔+ e* M0 K& f* X9 P0 a
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
% W5 K7 ~5 Z  s  C7 M* i3 }, H, B
+ c2 o6 b: Z8 ?- D9 \# T; R[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表