|
不知道发到哪儿~~权当灌水吧~~咔咔 7 i+ L8 Q. a5 {! i7 Q- ?4 k
) Q& m, K- Y! i: V+ Q
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!" V6 O3 C$ c! f3 s
# s% v5 m; l: P8 m5 ]9 G. g先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了9 g' P' ?1 `1 l4 l
; d1 x( z8 c( Q$ k0 {
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。$ m1 s' s) g* f
- C7 K8 c- c( M. wRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
" A y, @. R3 R8 d
: H2 O# v+ k9 e: I* Mcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)". Y! M( E& o2 R4 ]" ?6 L7 I* @
% ]4 Q7 R6 B$ T# G
就是说,Robot报告的东西就是Google能查到的。. K) K+ L. \# r- O, h# p- K8 i
: `% \* {6 J6 q+ ?9 _! p, c2 Y此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。" v* X5 m7 p% O8 { N
# y6 j' g1 D" J+ @0 r' g废话说了介么多,好啦好啦,进入主题!怎么做?
w+ j4 J) z1 l$ }. m" P7 A3 T( L! b m5 V; o G6 Y
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵+ O h3 J1 \1 h3 v
0 ^" Q4 g2 @9 Y4 c. g0 \
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说, Y, m6 L! G/ I( I0 U
9 m, g& G2 i/ e, Q0 w2 Z3 y
把下面两行贴进去,当然你要一个字一个字打偶也不反对
( z+ i6 [" @, q' m, ~ E4 [; p3 U/ V3 w) n* F: n3 E# t0 ^* H. T }
User-agent: *
; K" u; J0 d% t/ K0 f: [" gDisallow: /
" G$ U! [! ]3 T! h" `
3 I2 H3 B( O$ o) G! ~保存,然后丢进你的网站http根目录里。
. s& K3 t% @) @& H
8 n0 m+ U1 J% X完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
& ]4 f v* c& G8 d8 N" ]6 T
. A% s8 M/ d+ ?) Z# D8 F$ _( L等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
; N7 v6 \" \0 ~; d3 K; g+ a, j6 u( P$ ^2 l# M5 {
User-agent: *
I' J: I! p* g9 @. D# l" pDisallow: /bbs+ n" f1 [$ r% H0 Q, T
8 H6 W" I2 Z* F; k可以了!
) z! \' V7 q* C8 o0 O
& X0 D: h% g1 V再来个例子:
0 }1 B3 X1 a% h- v$ j6 ]
# `) t9 F5 T1 I1 h9 l3 I' X/ E- aUser-agent: *
. h* H: c' {9 d1 q. EDisallow: /pub4 V* b4 D) I# c, t2 h
Disallow: /img& k( w) i. ^4 k C$ h& l3 z
Disallow: /cgi-bin0 b4 Z8 N/ @. g+ {$ F4 [
Disallow: /forum% E$ T7 _" O% R C) v$ I8 G
Disallow: /shop/ d5 e% j( Y% h( m* n$ ]
' h( J, q6 h/ I* l( p2 V) F
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~) P! H$ L, z; ]9 S* T# r
7 j2 Q2 X0 @& N7 x, r8 o
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
, }' z: ^6 Y2 Z6 b( S4 A2 y3 l$ z. j4 D8 M- |
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
. R# a; ?8 h/ A2 ~btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
2 F$ v6 L; U" U) W$ `6 ~8 u' u5 r; D% c. @- e
[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|