|
不知道发到哪儿~~权当灌水吧~~咔咔 , i" l( \- e+ Q' i
3 K! |3 [ I3 f- ^偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
5 T1 M" O9 H2 R: d
5 ~1 |) X0 a$ L- `先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
- y* R. N# f, Y' M' B4 K. c; ~% S0 T( m- P
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
- W& _5 x( R8 p! I: |; D
7 `1 z& u5 P4 o/ I {Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
2 _$ g0 H' N: @
; q! P: n& H0 Q- o( I/ p; Bcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
* v+ M) @# z( i8 H) n7 w
' A% F; B. s! c1 S( x: S就是说,Robot报告的东西就是Google能查到的。 ]6 G* T" f. V3 Y2 V
7 v/ w+ ?( K0 w" @" Y6 n* i& x
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
: r+ U0 i4 z" }# H4 C; J( y- x8 G- a( g: T7 D* a
废话说了介么多,好啦好啦,进入主题!怎么做?! Z% ~ [+ y8 d7 \, Z! [
) C- ^7 h9 y3 Q8 B8 v
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
9 G+ q6 i7 N, _5 Z ~# c X7 M7 o- h
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说6 _7 @0 M' R3 q4 J
; E& p2 r9 _" L* f& S! x# z; J4 u
把下面两行贴进去,当然你要一个字一个字打偶也不反对
" @* `5 m- H! D# o8 F1 w+ F; Q4 E+ O
User-agent: *
3 K, S1 m+ _# S1 i1 y# L HDisallow: /
4 o i- w2 ~: R) Z& l$ d
! A O5 s4 c' l保存,然后丢进你的网站http根目录里。
- q$ q+ Y; o" D+ T$ I4 X F: Y. i7 r u' i8 |9 |5 f: Y y. v
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
# ^; E& _& n: f9 Y% |
9 x U) _/ t- o+ H/ N$ Q等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
1 J; V- m: c3 z4 ^7 k+ _) G: I3 [
% n4 [: Z: ]$ f9 gUser-agent: *
6 m% I" _6 F9 ^* R3 ?6 f+ LDisallow: /bbs5 ^$ s9 x7 h4 a/ M4 j7 L% _
% ~5 y7 c; s0 F9 d; c2 Z& d$ s可以了!
2 M1 w. ^$ p6 A: i- E5 m; j% S" z% _" u
再来个例子:
% i) b( F) f7 u6 }4 D+ ]$ W! Z" F0 g0 Z0 K
User-agent: *: C, C) ] P7 r3 D
Disallow: /pub
$ R0 y; Z# U8 Y$ l4 e* |9 dDisallow: /img
! o% j* w, H1 d- _% ^Disallow: /cgi-bin% M7 ^3 O+ e9 _ K1 Q$ L: }; j7 L
Disallow: /forum
: _$ h. ^) P. w7 x# G8 X- mDisallow: /shop
- C$ D2 O! H" `$ K. N) q5 s+ ~* T6 ]% s& k1 r, P
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~1 e7 Z2 j3 |6 R+ `
* R' M2 I5 T1 ]3 X2 E J
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
1 i7 L7 {+ o: c9 b* r2 D$ v. L: C7 p1 D8 q7 i
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 1 ]! K4 r1 ^' b3 K
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 6 e2 I* v6 C" H, p1 n
7 |, o& S3 X0 a8 F9 {
[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|