|
不知道发到哪儿~~权当灌水吧~~咔咔 ' O5 p$ u* l, A/ S: K" f
! e; F k9 O+ W8 Y. }2 p% `偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
. G1 ?4 V+ [: K, G" _9 t# F2 {
. X* S4 D7 N; r) w0 {( ^6 y先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
! Y4 M% }8 [' [( I- V" N& L. b# f4 r' H5 l
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
' l' \4 E' s1 d8 e0 Y4 \
`9 i. G; _' V, i) p+ h9 I. \Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
' x" W& d9 \" i2 n
, O5 m6 h6 i3 ycrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
$ O9 `7 @0 }# r+ d3 a( M
; c; N5 b' ^( F: y就是说,Robot报告的东西就是Google能查到的。
" p+ u/ U# a7 @9 H; K" [2 A; f* L0 o- Z+ X* t% B! [5 {
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
8 }( Q0 u2 ] S- B. {3 }" \1 k
% b" ]6 X( Z4 H2 a1 }废话说了介么多,好啦好啦,进入主题!怎么做?
: [, W/ u: [, A( Q3 D: U+ `. f0 l3 ?. O% C- k$ M3 f0 H; G; F
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵* \" u8 G5 L& K# X
$ H5 ?) P2 N8 G0 A; U' Y首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说+ }, U- D1 q1 Z% q* C
! \3 i7 s, P6 \6 h
把下面两行贴进去,当然你要一个字一个字打偶也不反对3 t- |! }) X; k0 G; w, m9 M7 A
! y8 F2 j1 H' v- M) a6 _1 JUser-agent: *
( x/ {4 ~( I8 E6 ADisallow: /
# ~( F" `! D! k& T- p8 t) E8 j& W. z, J% h0 W) _3 w
保存,然后丢进你的网站http根目录里。. d/ f. v2 l# t9 g$ d: W
8 o m4 Q+ d' n7 e
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
+ {0 F) g C5 {9 _' B
- H5 n- V9 D8 L" J等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
' ]6 K3 e0 l! W$ ~# ~; a; |: r/ h: n: I0 d5 H- R# i6 h# M; U
User-agent: *
% ?6 h& i1 f; |: G3 g) [ ~Disallow: /bbs7 D& ?, I! g; Z' |6 H3 J' }# o
5 M4 `5 f6 h9 j+ N
可以了!9 ~5 u! k9 B5 C6 e% c2 f5 |$ f1 k# _
: f( \) g: P& k$ k
再来个例子:
s7 W U- Y' X& l& ]- Z/ E* V M0 Z& R+ W: a) g5 s
User-agent: *+ H2 ~& t5 P$ {, d3 |, l' ?
Disallow: /pub; @6 n9 O! n! V' d4 g4 F4 s% U) _
Disallow: /img
9 {5 p4 R+ G+ X. Q4 k, g- T0 wDisallow: /cgi-bin
+ o8 {/ ~3 J" r5 d( q0 |Disallow: /forum
6 I, _7 E8 `( g! q4 u" Z: IDisallow: /shop# R/ [. S9 \: d0 C3 K& C
1 c8 j: Z3 u" R( f4 R看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~" D+ h4 {5 X/ @7 P% s" w7 }
( K5 N, u& R# F) h( N% B6 Q; S! a最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔3 s9 V- q f! }: t: ]
! K" _' n* T4 Bps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 ( N( n, o+ f" h2 U9 R( _
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 . ]1 [, }( ]# j8 ]
9 A, |8 S. l1 L[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|