作战2000论坛
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
[打印本页]
作者:
Newbie
时间:
2004-11-30 19:20
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
不知道发到哪儿~~权当灌水吧~~咔咔
/ _! t& u* `3 o4 k9 Y8 Q2 q
5 s! ?- G$ G+ U1 X4 z
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
- B- U" W; ?4 ~2 }
# F/ s: z9 M0 f+ L% v8 z
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
) J0 r. d2 l6 ^. y/ a' @
! `: i: R8 _! ^4 j5 ?) k P7 V( i
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
# _% g5 |$ P+ F* @/ [' z
) m9 Q# F& `+ u4 ]+ |1 x6 H6 C
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
$ B7 w* w2 x7 S2 m7 R
9 m2 v' {# s* k$ W- M9 V
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+
http://www.googlebot.com/bot.html)
"
- z$ J/ G5 ]. Q# d
/ S: j- `: X, x# q& s
就是说,Robot报告的东西就是Google能查到的。
9 ~0 I. z3 j2 T3 [8 Z& q. H
6 J* n& e3 |9 o
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
6 v0 X' ]- d3 t3 z/ h
3 t) M1 M7 T2 k) h6 H7 j; w
废话说了介么多,好啦好啦,进入主题!怎么做?
+ G+ Y: `! R" O, J( Q! D! e
' @8 Y# p: o3 \8 ^4 d
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
9 k+ B7 {1 q( X; X7 Q" {( @' n
# n7 ]5 b7 u4 j: Z6 `5 u
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
9 Y4 P& I6 j# B( F) `- ]/ C, I
8 ?0 p0 ]& t! e% d! i3 `
把下面两行贴进去,当然你要一个字一个字打偶也不反对
R# o6 i, X0 r
# ^4 k2 Z% J4 T m! `: ~. c
User-agent: *
7 l9 P% B( T& t" J8 U, q
Disallow: /
* _; g: l$ p* [+ P, x6 O6 a9 a
( j" f+ U) Q7 y
保存,然后丢进你的网站http根目录里。
& i; _9 i. ~$ B3 r y( C9 O# K
w& T5 B/ U+ E: Q
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
9 W# Z8 H8 |$ A( G$ U, Y9 g
6 j: U# y* p" D- g& z
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
2 d9 B8 ?7 W2 k0 ]# N/ Y
- {% q/ v# a" D, f
User-agent: *
Y2 e# u" ?( x% o
Disallow: /bbs
s* [5 _' J% \- C, V' a
1 \8 D) `% \. Q% n4 X
可以了!
! L7 ?+ i; \0 ^9 a; T H4 x
S4 j+ p2 |+ O; L) t% u0 a* J
再来个例子:
1 V. U6 |8 `& C( c n- }' X; ^
/ _1 s# `# y$ S& P. k6 c! F8 \
User-agent: *
5 B3 `; l- x6 S3 x W
Disallow: /pub
2 m) i1 ^9 ~8 `- O
Disallow: /img
% z/ h8 e" J+ b/ {+ Y- T* C
Disallow: /cgi-bin
4 t9 H' k, w: |: b" ^4 x- {. x
Disallow: /forum
0 w) t+ U% U3 p6 M) m5 l3 J; m
Disallow: /shop
5 M* \; F7 E, z; F+ a' s+ E
8 e# w' q; d2 n c
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
4 y) ]; h- c- Q/ U. Y9 I
) u, L x# j$ U- r; a
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
, x% j, b* z$ x
5 X! G5 j% H% E6 @; J
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
( s. E% }2 @& T `
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
" r' J7 c2 ?" c( K
: F; D- V$ O! ]3 A9 U" j+ b, W! M
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
作者:
HADES1974
时间:
2004-12-1 10:52
好东西,这阵风过去就又可以恢复回来了
欢迎光临 作战2000论坛 (http://www.combat2000.cn/)
Powered by Discuz! X3.2