设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 629|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔) l. O/ h. g, ], ?

* K6 |9 x4 m# O" W偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!6 n# N, ?$ H8 X+ _7 W

6 w' C* B1 W" M; @. r0 n先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
, y# U2 Q# [% i6 E. d* K% a! z( L  s
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
# ~- R1 }- g1 O  L$ \% Z2 ?2 t
. a& X1 t" e+ g6 uRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
( K; c) S' |& W9 j0 }5 h
" K6 e) d& W- z/ F' v! Scrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
6 E" z5 z' \6 q5 |$ q5 }: _) Q  g. y; L8 s+ B4 x' v9 B
就是说,Robot报告的东西就是Google能查到的。
1 _6 A1 B* e3 e& K9 M  F9 g3 H
* f" Y1 l( ?" D% `) Y0 B) G- t7 H此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。! B* r$ ]/ P5 r+ J) o8 q

  J8 Z( R# O* {废话说了介么多,好啦好啦,进入主题!怎么做?
* A+ J* U! @3 }0 _7 R! g5 x4 w: a- e8 A! Q( F) d" d, G1 U. c0 S
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵+ C- b* H7 m; }8 n; d2 Q! h1 d, r% t; Z
3 Z8 Y/ E" V6 ?& S; g5 _  T9 @' S! n
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
9 U' N9 n# N; [- A
" Q, p- O& P1 s( I. ~! y把下面两行贴进去,当然你要一个字一个字打偶也不反对' \4 b( L1 M( B/ n+ U! x4 L
( H2 Z- a' H! ?3 L
User-agent: *
: u- f7 Z/ T# j! y' m$ i5 I5 [Disallow: /
0 a8 [. H% X0 L) x( }6 t
- d' Q) E( S2 c) L6 y6 e! Q! i保存,然后丢进你的网站http根目录里。
) x  Z; [9 |/ Y+ J
- Q6 E1 y/ ?% v9 ~$ B完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了2 v4 f8 o1 a) i4 K' c! d
5 @1 s6 ^5 k/ B( a9 t
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题/ a/ X1 K: ?/ N  `

& z; B3 G3 e) _9 U0 uUser-agent: *- @' q% U0 N8 y4 `0 J. ^( I
Disallow: /bbs
2 h8 w$ B  }6 \7 ~$ M8 Z$ }8 @
. x. m* W# T) O' T$ {; a' k可以了!8 @7 }4 V- W' l! D# B2 ^% b
9 G% V2 K* I) o7 [* _* u8 N* Q
再来个例子:4 x1 G& v4 ^  j9 J  j( W- B
7 y4 `# |: {: Z3 X. f6 }' e
User-agent: *
* t8 ?* `$ t: t8 r$ [# IDisallow: /pub: X, Z+ \1 Y6 w% k4 Y- J0 b
Disallow: /img
' }2 _/ Q1 C% _6 u- }Disallow: /cgi-bin& g; o3 _9 i3 q/ A
Disallow: /forum
* z0 @) B9 O6 l0 F+ p( g  ?) ^Disallow: /shop. H7 S0 h4 S! `1 W6 J; K
8 O0 `" S' {3 B' U3 p5 u2 ?
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~1 e7 N; A( R9 }6 ?1 h# i5 {# Q
0 H0 V) m3 P/ k: W0 \
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
" n3 ~5 s: C3 p  P# B
, R$ W2 G9 @) J  _# ips:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
: U. A' O7 ?' L" p1 u. J& B% pbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了
$ j' o: k! Q0 E- D1 w+ B+ W5 _
/ o7 o; |- ^9 Y[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表