设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 667|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
. S1 j( y# f7 X7 D2 c4 S7 p
, j: y; Q- w# x9 @/ @2 n# k偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
9 [1 h7 K* ^+ t: [) V  U1 H) Q8 y; U) q/ D2 c) x4 r0 q) c- K! B1 s
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
" V, r, d$ K" n" W: }0 L/ Q0 Q
4 H* r' r1 Q# z" J: z网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。$ q& f( i5 g9 T2 w2 S

- e5 L; }$ b( p% Z0 eRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
. m7 Y) H0 t: E" A5 d: @+ @* m0 b5 v% q5 s" O
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"" N7 X1 m- I1 b9 q0 y' R

/ Y2 K5 Y7 K: n2 s) \; h. v就是说,Robot报告的东西就是Google能查到的。
& v  h6 O% e, X1 @
/ r: }. d' Q1 M8 d2 b& E' A此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
4 E7 G8 M" Z. T; |8 m0 e
: z5 I" ]3 _2 Q废话说了介么多,好啦好啦,进入主题!怎么做?
4 K3 }" M; Z- E# _4 a0 Z+ S4 K* x- d/ w- z5 B" D
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵; h0 }- v" c& T- n: [; Y$ h

$ d! _- g- _; C首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说% b: a) L' j8 E3 E7 G0 i$ W
; H3 y2 x# R* l
把下面两行贴进去,当然你要一个字一个字打偶也不反对
( N1 G1 u9 o9 g+ N9 A6 Q7 \. D6 y* G1 d' g5 k
User-agent: *
/ A) v% ^0 W& g; {6 [; dDisallow: /# j9 x$ K6 [) {

4 U- B+ k/ O2 x保存,然后丢进你的网站http根目录里。
+ U- J& C4 q, j4 Q! Y; W; D; t. J9 k, r! ^  m8 n1 g
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
- y& p+ E0 p( ]" @/ I
+ T# r% Q( ~8 c# s; @9 }0 w" b! x等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
3 x0 z) s8 H- x
8 x' @5 g* g: e  t0 }) jUser-agent: *
/ h$ S0 E! |0 ]) l- v9 sDisallow: /bbs
3 n$ S* U3 I4 z7 ?, ~3 u
+ P$ l2 m. u$ S' G: J' g可以了!. l" {" \5 L0 P! X$ W+ Z' w
/ x' l& K! V$ ~( E
再来个例子:
" R) A1 f( T% C6 o  x, }  A7 l" ^$ l) ?9 e( T  L9 D6 P
User-agent: *
: j  Q! p& M9 @2 ~% v$ ]Disallow: /pub
, |- g! `; m- X, z! e% ^Disallow: /img
1 n( ^- ]4 r  R0 s2 p3 q0 nDisallow: /cgi-bin; ~1 L: o8 P" F1 Y3 E
Disallow: /forum9 g9 T  n. B& k
Disallow: /shop
9 p$ T. x9 O, w( _6 c0 W6 M1 l+ ]* y4 C3 `' s
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~: H$ u+ l3 L) N& J$ E: V  D2 J
& ]  Q& F% o: q' a9 G) D" S
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔; e1 ?! `+ l- ?8 u* b3 G, C
( Z# g' Z$ g) H3 T* m4 s8 R
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔1 l! b% Q+ S! y6 G$ }6 Z3 u
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
$ c7 o& h3 T/ L8 z3 h. T6 C. P9 G
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表