|
不知道发到哪儿~~权当灌水吧~~咔咔
V; M/ d- Y3 {1 ^: o
0 F+ \4 _* ^# z, v& p" D. U+ }7 ^偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
- k" b' }4 j7 ^2 g& H7 c& u4 Y$ w
2 T* T! x$ k' s7 X先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
3 G. a3 H; p% T# [
+ v7 F) A1 |3 b9 V% [3 x网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
8 a5 r$ b& `5 q5 B' D% \ Q8 z; C
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
$ m; R0 j! q0 a" S0 N% D$ N! Z" I
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
) t1 `- y4 L' w6 s/ E
5 C# ]# Q4 V1 D" t7 I8 x- }就是说,Robot报告的东西就是Google能查到的。0 @: {: R0 T" P
3 O3 r# h6 F( M F- e( o: D s' M3 @此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。6 A# `3 d$ R q1 q/ \- l& N5 `
1 T4 x1 a% w1 |, l2 Q! N; \
废话说了介么多,好啦好啦,进入主题!怎么做?: S" d9 X- p; T* N
! {7 P% }1 n( A! {- g真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
+ m+ H. t4 o: B
3 [/ ?% }1 O8 [2 O% k. y4 g首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说0 U% [ F2 ^. T+ I
7 E; H& b' P: }* U4 E8 W把下面两行贴进去,当然你要一个字一个字打偶也不反对
& m2 a# z. M' w) Y- N) t9 _# s, n v+ a- K3 _
User-agent: *% ]" \$ a1 g6 H' `" r X
Disallow: /
7 @& [% X6 u3 W0 ~8 I+ C8 o3 E
$ q: q2 b: F3 s9 J+ c. J" s6 H保存,然后丢进你的网站http根目录里。; N, l6 `- j% F9 y9 {
3 s' D; S- E9 `8 x完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了+ w$ P1 ~1 A% Y7 X- @
8 J5 O1 g# {0 u8 h) A6 w- Y等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题7 l0 A: w& p/ a+ j Y2 B
% T3 l7 U2 L+ L# w# c) MUser-agent: *$ A) ^/ K" u, O* W" x
Disallow: /bbs4 @% o4 G$ G, z* f* a+ V
- @4 B5 o2 Q) q' ^2 s6 G; v可以了!
, Q( R O- s) n
$ z7 \7 }, A* w* i再来个例子:( M1 m1 I8 L/ l9 ^) Z, ]
+ W& S0 O" X: y; t. p/ ^User-agent: *' o4 [4 P: p7 A4 i3 m, `
Disallow: /pub
# q: n& R6 ~% |( ^4 VDisallow: /img* K6 J: k, ~" C0 X- b5 h) k
Disallow: /cgi-bin; H: j% w, r* @' P) p
Disallow: /forum& {* L9 e/ K% d/ a; m
Disallow: /shop
9 y- c8 ^& K, t' N( x) H5 l0 H/ E+ Z1 s: F7 }
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~% F O P# L2 L ]
3 ^& }' a4 I( i! s9 {& P最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
4 l: A1 x4 Q) z ^& H3 ?; {7 n' P9 D% t# V/ X u; I
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
- @% w$ {6 r' J N* U/ x7 obtw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
6 s' g9 `% G1 Y
. U3 t1 {! ^3 ^- f( W2 h7 m[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|