设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 701|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔3 q7 d% j  b5 s9 Y- y

6 z7 V% H' E% F4 S+ G+ U  Q偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!! d' U! E8 i# s
% C( x/ p, b4 x7 z: b0 m! r. \: G+ M3 l
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
" m$ q0 i, U2 t  K3 H0 x+ J! y4 x% w$ D! u! k; |& J9 e* a
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
6 I! ?) ~! Q, T  J, ]5 a' K& l# v5 n" {5 r8 w
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
1 N$ C" t6 ?" ^3 `6 V: }- |3 {; }: @6 M! m8 [
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
) ]: e+ S9 ]6 s' S6 z3 R4 W/ J" Y2 G' b, _. ~7 |3 F/ ~7 g( R
就是说,Robot报告的东西就是Google能查到的。1 l& I* V% ?$ E7 p% s. L. P0 p2 z
% i- H" y  M/ }
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
; s. c6 U& o! b
) T5 B2 F. _' f: l+ O废话说了介么多,好啦好啦,进入主题!怎么做?. M# p5 z& T0 b" t1 B
* p" ^; H4 J" z8 r
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵- L: w4 k" l! D( n  [0 Y
" c: ]: K' o+ k! q; u  T
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
( p  @5 R& \1 F1 |. n0 I- u/ S5 l2 n! u/ l' H
把下面两行贴进去,当然你要一个字一个字打偶也不反对
, v" X0 Y7 a$ R' |: D( y, D
) @  B& F2 J; b9 P  r$ o( aUser-agent: *
, v, ?! D5 a/ R1 o1 }7 b' RDisallow: /: i$ S. `% W" l2 ^- T, _

( l' [6 j5 N+ v% I: l1 p保存,然后丢进你的网站http根目录里。
* o, v1 [. a0 c0 O, P* A' u6 g
3 o- }- d& V$ m; }6 c完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
% g1 t7 {, u( r" K# b; I1 i( ~# E' `( Q7 ^5 |  V7 b
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
, l0 e( B& c( B+ n8 o4 J, U% [4 i% @# {* J4 @! a1 U
User-agent: *& m: T* |( q) ]  Q
Disallow: /bbs
& x- h. f5 @, e* W3 ?# m; F" w% g5 B9 w9 ^
可以了!% h' e* v- d2 a! \5 [
. Z* N4 M: j* f7 W+ o, B
再来个例子:( i0 N; F5 M- q# S

$ m$ L% K1 T! u- [! E3 cUser-agent: *
" o) F  P4 J; l0 B9 y; zDisallow: /pub3 w! d! S6 Y1 X; {
Disallow: /img! y* Q5 E' G3 v
Disallow: /cgi-bin! [0 \; ^8 e6 e9 E5 a* V
Disallow: /forum+ i) }% \' k* z* n- J! @( p
Disallow: /shop
8 n1 ?" [- i" B; h$ R
  Y. A+ s9 H3 `+ ~看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~- h) U$ y! r& T/ R
. \  X  ^4 ^0 w2 G- h
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔/ y, F8 D2 I8 `. H5 ^, u
; K2 }# m- X9 l# e
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔- w5 ]" t8 B% J4 Y8 L5 C$ E
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
& _( P- g- D0 K1 k9 |9 B
# o6 V5 L7 R7 x$ x$ i[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表