|
不知道发到哪儿~~权当灌水吧~~咔咔
y" x: k$ G' P0 n: b" ]8 ?# Z- P- E" A; L/ d5 S. a2 T' z
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
8 [- ?) P* c7 }8 b' x% B3 R+ Y4 O' r; Y( ?
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了6 f+ P; C' k5 f' O
) x# s h4 Q5 B/ f( _2 o9 I网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。: k3 D, J5 m/ ?0 l9 i
4 U7 u; j& p( ~5 L+ O( _
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:8 _ H; L% E+ }. c {
( i/ V& p7 l$ D% n6 gcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"1 v7 c/ w* W1 `3 k3 w
8 |4 |3 `. |" F! K( E- r5 f& a0 G
就是说,Robot报告的东西就是Google能查到的。, q3 e; \, X" b" q( }+ F2 T
. D2 W( ~" u/ U
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
1 W$ i3 t; }. }5 o
) b! [& ]- c0 V9 B% z废话说了介么多,好啦好啦,进入主题!怎么做?
# A& |: {7 ]; c
! i% U) B" s: [1 s- ~8 D真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵0 K5 C; {8 I2 A# h6 V: n- M
, `, _! A# E. `6 W3 [7 T' \首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
) ]) H$ b3 @2 g4 N# Q
) T7 L; B& ?' F7 Q- h$ P- }把下面两行贴进去,当然你要一个字一个字打偶也不反对: d# c, a' j, ?) p
! n# s e5 y! E! J0 E- B
User-agent: *
' {0 c4 ?. T J, s2 l: t/ FDisallow: /
9 ~, t" Q5 G8 `
9 j' a& v H' z8 A; V8 {, P保存,然后丢进你的网站http根目录里。- V; Y$ r/ x8 H d' ~1 G4 `% x
6 O. K! y; Q& }. C1 K完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了) s' P8 n+ q7 V5 h
1 V0 `( T$ O! d4 J
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题- M- c& a! g! Z% k
* w" Z2 q! Z% l" ~ `7 B5 ~User-agent: * v+ R. w* v2 `. }6 i; W
Disallow: /bbs+ |' K* I" {2 j! ?# `0 j, T; V
) V& a- ^6 h4 i$ m E可以了!3 V3 s: Y6 V7 _$ {* Z, C* U
# |) \# Q6 w" V( ^+ A再来个例子:
! `9 x6 O& {' ^) `8 O& z' e) f' l1 r: A
User-agent: *
, {# h4 N& I$ G) [7 lDisallow: /pub
6 t. D! P- @1 ?Disallow: /img) c: s5 u7 o8 R* Y* k, c
Disallow: /cgi-bin+ U0 l% A1 P2 H( w' k1 r) [! ]
Disallow: /forum, r$ E. Q$ h( f) Y
Disallow: /shop
% k8 e" G/ M) j1 J" D1 N; S; S1 s3 M
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
3 X" R; \/ h0 N, B, C: h H8 r0 M* i9 ?! q
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔- o! |! W O+ Y# v8 D
/ }2 B/ h1 J4 J8 H9 K$ pps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
& ]# U) C" I! L% x! {( vbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了 2 o( { E( J2 A
. E3 }' u9 v" h6 L0 k
[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|