|
不知道发到哪儿~~权当灌水吧~~咔咔
7 [3 k/ W0 x: J- Z! ^* N7 x& n: G T z
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!$ n, s- O) g* \$ p; c4 c8 `6 }' G
2 Y! ^( T& a# k; H' R
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
& q2 O9 P2 P. @' u- l1 e
! x2 m: B4 b; i+ n3 c. G: H% y, A网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。# b1 j" K8 Y) I, S2 M g
- x3 T' ^1 {- I
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
7 F5 m/ @# k. b& O) b- b6 B& ~$ N% n: p" L# n7 e; K' t
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)", J3 A j% X7 O/ @) z
+ r0 q+ q9 I9 i: ]; A$ E3 t d: s3 h
就是说,Robot报告的东西就是Google能查到的。
- Y4 w- m$ Y. I9 U
- w5 t9 @. S7 Z! C此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。+ l5 z$ D2 v, M2 q8 v/ l k0 X
# @. o G/ h* }3 ]5 H
废话说了介么多,好啦好啦,进入主题!怎么做?
& e" n3 k( N s% g0 ]3 s
& O& s8 ?9 K6 d% X3 n真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵8 @6 N y+ V0 M
6 l1 m# ]- j+ h首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
# x) \6 z* W8 _1 |5 r6 [- e
5 g# ?8 r3 S1 z: d- ^0 W把下面两行贴进去,当然你要一个字一个字打偶也不反对! U+ B& K. X' v2 g
- h- H) x3 }' x6 NUser-agent: *
* Z: q" y; l3 X8 R3 E# [6 SDisallow: /- @0 m& X6 n6 u4 O( z
' m2 g4 A7 e# T
保存,然后丢进你的网站http根目录里。: k. Q% l8 g' z
! f0 R' o/ ]- f* C; r7 A完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了1 q9 n! Q& Y/ w: `$ r& I
$ V: M- v, P% P# ?5 o4 T( |& B
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题% o2 b1 e1 u. D9 {$ n
& y7 [6 b% S" u3 G* lUser-agent: *8 c! `2 `1 u \8 J" F
Disallow: /bbs
# A1 \& Y( n( R$ N* s6 H( \8 e$ a8 w+ X5 N7 H
可以了!
2 k7 v" m" @8 y& |0 Q
8 g4 S- _ G: }, K9 b) q再来个例子:2 W" I' S7 X- @/ s5 i' l
" U" \1 q, R! y* N T6 W
User-agent: *: Q, j, a; _2 `0 j; o+ ^0 v& o
Disallow: /pub# V3 Y2 e* Q2 O
Disallow: /img) J8 D( T" Z, P. V# f! c% f
Disallow: /cgi-bin- |* C+ V% v' ], B6 `/ i# B7 Z
Disallow: /forum
8 K7 \; A+ M# F; g2 YDisallow: /shop, G3 t3 T% R; i
2 J: y$ k. A0 m! T+ f看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~2 [. N) N9 Z% O/ e+ ^+ V
, L$ c( A; ]* I7 w5 D- L$ n最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔. G3 d" E# S6 l6 H z; S
5 c2 X2 U1 e) P% y- E
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
8 i$ i9 L% g6 kbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了 $ D7 [/ h& h$ ]: L2 \1 j( C! K
. w, E2 w- `1 V% l3 A( c8 e- L4 t
[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|