|
不知道发到哪儿~~权当灌水吧~~咔咔
% q7 C: J' f0 Q+ [" D9 N& Y; D( l7 _
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
9 ~8 ?, n( \4 Q$ s9 u: n3 m
9 r ^0 L s7 g& Z/ e% x& ? J先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了6 |4 S9 a5 {1 C0 I: T1 F( c
/ m! u n1 o* |" {$ J5 O) D( ?网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
8 x; q* S3 P( e. l( N9 M2 z8 b+ ~, g6 {2 d# A2 N6 Z7 \, R
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
+ l' k2 z K& F0 I
4 F9 w# a- \, @2 y- @crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)": E. Q& L, H' I) p6 E, a
3 a' W4 e4 b1 K/ J1 f
就是说,Robot报告的东西就是Google能查到的。
4 ?$ w9 y3 @0 D/ F! z" ?) ?
6 p9 q# j; C$ V1 g3 p2 j9 C此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
3 Q1 C" q% U1 U) K( m- x* q% r! s5 N2 e' j$ R" F
废话说了介么多,好啦好啦,进入主题!怎么做?8 o5 W% N7 L; t4 k2 l( E
+ T; o7 F4 u. C5 n8 m
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
& d a# g/ e: X
# t z4 a0 I( p: D- N首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说! s* H% a ]$ {& d( t* l+ f
- k7 X1 g5 n4 `! ?9 y把下面两行贴进去,当然你要一个字一个字打偶也不反对
" f! h. P' `1 A* h$ @& a% l
8 l; J- a9 \% J7 M, z! X/ ^+ w( HUser-agent: *3 [1 k* f6 a8 V
Disallow: /
" e! c/ j, H' t+ T' D9 u$ [
9 a1 L! z2 ~8 ^ R- a保存,然后丢进你的网站http根目录里。
5 r( w1 S. O% \' E, G9 g$ R5 C1 p) r
- m6 K- {! Z: R' a* R4 W- f完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了; n: z' Y9 Y% `2 T7 t/ v! R' C: [
& i3 f' k7 j) E/ K1 Y( b! q8 u w等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
# X2 |" M: m* F$ d: ~% L6 J3 K0 b2 n% ?6 w
User-agent: *
0 W% r% M: f& T3 z3 n nDisallow: /bbs
r8 ?6 a" V& o4 x' J2 d( j6 [4 p
8 f" P$ b; G1 h# ]. _. N可以了!7 C0 v: ~; n0 R. Y; v
$ ]2 r, G$ f# G) K# j4 @+ ^4 ~
再来个例子:
# d, E5 i" h6 M- M$ U6 [9 U
1 q1 v0 z9 ^' p8 mUser-agent: *4 z4 V1 i: G8 \4 n
Disallow: /pub
2 K0 E9 U; B5 I8 w( sDisallow: /img% `6 W, Y! I+ {
Disallow: /cgi-bin4 n# L1 d- z; c5 m
Disallow: /forum3 F4 k: e2 z# Q4 Q: E% O6 `, w
Disallow: /shop* `3 y# b8 ~+ x3 K* ~' \
3 [# b, e* M, C1 D3 D1 g( s) ^
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
# J! Q* ^1 x; G3 X. d& C2 M' o7 D
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔7 a1 u X1 t( Z# p: `( e a! x
K8 P2 }6 n8 ips:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
9 J2 {* x, f4 w' j* Qbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
; D9 X3 }! m. r& S: K7 h; E
* ^, T y% Y! b, F* F[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|