设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 630|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
) ~% g4 G; q7 F0 f' N2 I6 K5 S7 l
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!" g) {& `9 f; n; z  r$ t

! a2 H) M9 R, X! |! c先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
' o8 E5 s' v' d( B2 m$ d
2 m0 P) G! q6 F" h& P5 F网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。% u% U+ O9 x; z- x+ z/ n* v
( q5 A* O: W5 d
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:5 J  ?( e1 N% J' K/ P

& @- ~9 ?* z# ~. c3 _& [  Kcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"! S9 P; I8 i% T% T8 I

5 g# r& I4 h7 u8 ~; }2 ?: g就是说,Robot报告的东西就是Google能查到的。5 |& n2 c0 [$ b" t9 ]% Z0 w

6 ?# R* ]6 k2 @/ E# l) q4 H此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。0 o* _4 W  D" W7 N+ w4 ~- _8 h
7 b; F9 v4 G4 S3 H3 ~
废话说了介么多,好啦好啦,进入主题!怎么做?
* \- i4 c( R) f
2 N* O1 G, K# [- l  A真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
  {' n  G; P/ d2 |  E1 @) W' M, h' ~3 J/ k
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
+ t" Z3 }, O# p, N: T. Q8 u1 G9 K( O- z1 }) D
把下面两行贴进去,当然你要一个字一个字打偶也不反对1 J" V' F  w5 A$ E
$ m7 C, j! {; i7 k' y
User-agent: *
  A  _: s& F# y8 a* PDisallow: /7 s' W1 r% W" b4 w) v

0 [, U) e/ A+ k1 W* F保存,然后丢进你的网站http根目录里。
! j  M+ B, \5 V3 f# N3 D) J6 ~
% ?% _$ @3 j! d完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了" [4 \- S9 k; W; s* Q
9 a" Z# q  M, U  f. a+ ]$ l5 ?7 [
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题" N' W5 j" e! ~/ ]
9 I) B$ F- t$ e# H/ g. j7 H, i8 b4 _
User-agent: *
4 l# a9 F3 O' E# Y/ w" yDisallow: /bbs6 V2 d  v9 R1 l8 @. ?" Y

3 N7 g& I# x% T4 Z* M8 ?, L可以了!4 ~; N) K5 h% G

+ ?& K9 g& n& @9 f, q9 O再来个例子:: F8 Q' D# d9 d. L5 Y1 O/ p
$ g) n* Q5 F2 ?6 m/ D! X9 G* B# ~; I
User-agent: *
# z& ]4 s1 w) F& l) \6 v) C- lDisallow: /pub: g, u) L+ m% `
Disallow: /img% z: H$ a* m/ Y7 S, C+ n6 R
Disallow: /cgi-bin
! I0 h7 `  c4 n2 ~( W' Q) X* CDisallow: /forum+ F1 [# F2 a& Y
Disallow: /shop3 T' I/ g5 L& d* m
1 Q3 Y( |2 J6 w( p
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~. i1 \8 s! U% j; S5 c
# G; F6 F/ [' b! g/ k/ w3 E6 Z* G
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔: A. K7 [# h; u. k
, Y  `; O: F) Y7 k, j0 H* M
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
8 X- }4 O$ W( F. h" D; Dbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了  R5 P2 D% @$ H, `( H, z/ `: q

. V; J) ]: y0 p5 ~# G* d$ a; @[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表