设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 700|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
: l( G, ~9 F7 @. D5 l1 r% A: x5 x0 b  V4 u+ ], b% y9 I1 a+ i
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
0 E: h. g  }; t  q
% @* f" @& x) `先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了: e+ s2 g) Y2 W8 R$ D5 M( R
+ T' K5 @9 K; p- q& U
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。% B- r. U2 s# H: J) ]" V5 R+ D

0 D" ^  @/ _; vRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
( r( ^( u" D# H( z6 f) G' f: M) d7 I9 {9 ^, J4 V9 J
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
% ]& X5 y3 l* ^  v1 a8 k7 T7 D: U0 C3 [
就是说,Robot报告的东西就是Google能查到的。: g+ w- ^, @6 V
3 H6 r0 ]8 P: W
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。7 f: z# b& R$ e
0 j7 {* B& Q! d  G( _( h& V# g
废话说了介么多,好啦好啦,进入主题!怎么做?
/ `' [  V! k$ _
: E4 s3 Z- R  y* u真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
9 L4 B6 j, I% D% N5 s. n. B: `+ r8 O3 Y5 M
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
% o% j5 p" w) X! o! `6 U" M3 D" X$ P8 N: Y5 D! P  c. Y0 |
把下面两行贴进去,当然你要一个字一个字打偶也不反对
! X  o0 o- k5 q5 b
4 |6 V: X4 |2 XUser-agent: *6 F/ i$ h2 W, x: @( R2 x6 ~% @
Disallow: /! h, i$ p# J- B2 K& y/ w

& @5 N6 N$ Y" f/ r# c5 w7 D保存,然后丢进你的网站http根目录里。
1 O7 [% g' x5 K& k, @7 H/ H0 Y) ], e/ f6 I
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了1 e: ?7 K" H4 G( L* @
. d5 x: \6 a, R) D. j7 m0 G
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
. i. ]) A# ^( P$ u( ?' f. y5 B) N' J- U$ T5 r8 l: f7 h, r
User-agent: *
. i2 J; r$ H7 a. i7 l1 GDisallow: /bbs
- Z3 w$ @1 B7 s/ b  h- t; b" I0 m  J4 X0 U5 W) B
可以了!' x" ]6 G0 X* |, _' S2 Q3 ?3 e& ?9 `

1 g& ]$ y6 j6 |( v, s再来个例子:
+ {3 C  L; c) b7 ^* e  v5 [- X
) I) i3 x7 D# R& dUser-agent: *
' K8 `) }" Y; JDisallow: /pub' H! l& i2 q' c8 s
Disallow: /img
" q% Z7 ~5 \) hDisallow: /cgi-bin
/ L4 @: M; ?, m: f+ r1 yDisallow: /forum! s6 g' p9 T6 u* U& ]5 N
Disallow: /shop
7 C& u& w+ D' {2 ^4 {8 O$ w
8 e" h+ k8 k' R. f0 r3 Z8 \看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~0 i' I% c+ F" w0 {$ l+ d. g  Z
; v7 U# l9 A7 a! V4 K
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔& |: c1 D+ l) G# A$ w
& K* ]) s0 B1 k" e  Y# G
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
; a: ]" V5 ]0 @( n1 p$ Rbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了
$ N% F. p6 p0 O8 P' @! {+ ]3 [! |4 ~  q1 ?
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表