作战2000论坛
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
[打印本页]
作者:
Newbie
时间:
2004-11-30 19:20
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
不知道发到哪儿~~权当灌水吧~~咔咔
8 p. y7 {& @8 R* S0 V7 L# i
% q: R: B+ w' `# j
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
4 e$ k5 ]' l2 B0 G2 \/ _+ G) m
" a7 o+ q: [* D, o0 e' f
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
4 f1 ]( H2 c4 S
- @7 s0 t; ]: K; a h& V5 G6 d+ O: u6 O
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
6 F9 {3 a, y0 o
/ b3 g3 P! Z% K) P/ W. k
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
( P5 h D6 d0 u3 A0 B6 p+ b+ p
) x* ^. k5 M0 J% j
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+
http://www.googlebot.com/bot.html)
"
( H1 Z* G) v7 Z6 z
$ T. A% o3 _8 C
就是说,Robot报告的东西就是Google能查到的。
7 O v; Z7 d; ^ [1 i4 j5 w. \
2 n6 f/ p" z7 ?1 G% {) N4 g' E
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
8 `/ C; k" s6 C9 o0 y# n
6 x! ?, F5 w& y: T6 V6 r
废话说了介么多,好啦好啦,进入主题!怎么做?
j9 ?2 d9 F {* z$ }5 v
# j+ B: K, E% F; f- a6 F$ q2 `: m! ]
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
4 h& B0 a4 P. ]$ N( R1 b
. i2 J" G: R7 ~5 k
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
/ f1 J2 w! v' F- h
/ v p& T9 p7 d6 s- |/ {
把下面两行贴进去,当然你要一个字一个字打偶也不反对
3 W) \0 f+ e* E
5 h3 }; l e* y3 m
User-agent: *
" ~4 i) N: y; c
Disallow: /
0 h) m% i4 E* `+ ?1 O3 }; f
7 y: [5 {" L* U' N# e) S" B, A
保存,然后丢进你的网站http根目录里。
# U- X4 x' J" F
# F8 z2 s( r' p
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
6 \% h/ A B7 m2 x2 o$ k5 H
; ?6 {6 F% W: Y$ q, \: m: S0 T2 i0 V
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
# c, w" l4 _' D* P3 o R
: |% k$ z6 W6 B0 g9 N! }8 l6 s
User-agent: *
$ h( \" z9 @" h; Z: G, V* a8 N
Disallow: /bbs
3 S: R) L3 j0 F/ ` h
R) z3 d6 E% B% G9 K/ L
可以了!
, ?4 g" R* U1 f: b
8 y6 I/ {% U- n1 I! C, L# t- n
再来个例子:
% x1 B ^( ]" F# q/ B
2 g7 a+ J' m i% }1 L: S k
User-agent: *
8 r1 G- {' G* U. n6 n( N/ l9 l
Disallow: /pub
9 M0 i! l1 y* _
Disallow: /img
! b# `7 u7 W' |! B' v" d
Disallow: /cgi-bin
; q" n* ?* [$ Y& b% ^
Disallow: /forum
1 G( g Z; j, w, ?
Disallow: /shop
Y4 X; y. P; V) ?9 x! z$ Q
8 c1 P( p) w1 W, a) H% _
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
/ c; z! O9 a% A7 [% G
, P$ c! Z" b" |, q5 c- ?) ]
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
' v3 `2 {4 w( L
( S( ^; K( Y; v/ |) r6 i
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
- i6 T% W U" _1 n4 {% a
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
! b6 A; D% {% j" t
& D2 z, @$ E. ]8 Y4 E
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
作者:
HADES1974
时间:
2004-12-1 10:52
好东西,这阵风过去就又可以恢复回来了
欢迎光临 作战2000论坛 (http://www.combat2000.cn/)
Powered by Discuz! X3.2