|
不知道发到哪儿~~权当灌水吧~~咔咔
( I1 H: @2 ~0 s5 I a' k/ q( t4 O3 o4 w! V
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
+ i" o% W. l' l4 s. c$ q/ Y8 Z& @; W* _0 u! c4 M
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了% C4 ?! p3 G* r) P6 w! U# ^
D; c, V7 \. J0 @4 n; X7 e( ?网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
3 n1 v, [2 |+ q/ m- x' ~* ?: L! f& |( ~' q
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
8 e, W' _, [5 L9 z9 D8 `+ Z: ?
: T: o2 Z( F0 y4 hcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"( Y1 k$ n0 B: u+ m# |5 Z
. S& R2 M( X2 E6 H
就是说,Robot报告的东西就是Google能查到的。4 P# M5 w8 v, }2 O/ ~5 H7 Y$ Q
+ \: W0 { o% }
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。, T" _' f2 P8 N6 Z' @
& y9 s3 v/ _! V- }9 F _! [2 c废话说了介么多,好啦好啦,进入主题!怎么做? L2 \: ]' ~" i6 ~
: A1 n+ R( l- z: U7 b8 I4 @6 O! B% i真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵! `9 ]7 g8 D& v
0 o, K) c& }. ~& B' N: t# E首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
h0 u$ w# l) _1 o* f5 n5 T
- t7 R& [6 H% q- u# _" _把下面两行贴进去,当然你要一个字一个字打偶也不反对2 m, A8 D h; [
+ R8 I) @$ q1 RUser-agent: *
( W3 v: X4 A' j: V* ]Disallow: /
, f, u; Q+ A/ _0 h6 C% u2 w7 G- X3 `1 Z) B5 ?) B
保存,然后丢进你的网站http根目录里。
- r0 t2 a% B6 j/ e9 i/ H7 Q4 ]: a! a3 A/ v J4 m5 c! x% y) D
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了; p4 H6 k1 S6 `) A. C! A
2 @- z: c( g+ E7 q
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题/ ^& N3 g X8 p( U1 i. h) l5 _( d2 }
% w [4 f+ w$ C1 V. x# K7 Q) u! G
User-agent: *
( ?- B) j8 Q( H! l+ y5 A' fDisallow: /bbs
/ U: f+ k; k. N" @9 `5 p! x: c* r- x7 ? d, C+ T, f
可以了!
' z: ^& `' ?$ `" G/ z: s9 K" |, {
再来个例子:3 u# w" `- d0 r0 e' }
4 s& U) }) @7 ~* X6 n' G
User-agent: *
* F/ y$ P+ `) Y0 W) Z7 T! BDisallow: /pub
5 e4 F, t* b, D3 O ~/ gDisallow: /img
' I9 H7 {7 M7 {+ y8 w2 O# O" qDisallow: /cgi-bin
4 Q' t; @+ P( {. XDisallow: /forum: R* x7 B% @7 U9 Z6 w
Disallow: /shop
* m9 P' ?8 e2 ^7 D {* c( w# h1 M v' K
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~8 q4 o, \' k* x
. j1 b, W7 t% X) M& f
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔- m. }# o+ G1 Q2 o
* R9 a, O8 d4 P6 f
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 8 Q5 a* j% F' L1 L& f* F% \$ D
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
L) c2 ~6 Z0 M
3 _+ O& W) w7 k* k: M9 G: P[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|