|
不知道发到哪儿~~权当灌水吧~~咔咔
! b: @/ k% x) ~, } C& d2 r- H8 u) h: P: x$ k4 B7 Z; A3 u
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!3 X6 b; m. v( h! W7 ?8 W2 Y
6 i, E1 Z& G5 I6 U先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了2 u% |5 n0 ^7 [
+ P& c m' B* I2 M, J8 n/ _+ E
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
4 z- P3 n5 }8 b. I4 ^' a: D- R
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
, ^) T5 _7 M/ W# ~
$ u0 P3 q. W0 J, O1 R. y& V7 [crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
* o. g9 f; N* b2 j6 H* B
# N0 `+ m C% F就是说,Robot报告的东西就是Google能查到的。
+ e9 `$ S, f$ j. [ m0 ^/ O
0 m- E/ M2 G# N2 \0 f6 {此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
/ s* {4 n$ ^$ j9 i1 p. d# e2 U. }" K
8 a: k+ t, R; F Z9 G( s' k& ^废话说了介么多,好啦好啦,进入主题!怎么做?$ M6 y# U2 R! D9 F
, E0 V9 a( }/ R. G5 `9 s; t, ?) d
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
+ V4 y. |" D1 u- A
; n9 ^- \2 Q) d3 j% N; k首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说; _- X; b7 i5 p
* \; J) G& `& `' T* r8 Z2 O7 I
把下面两行贴进去,当然你要一个字一个字打偶也不反对; ^& R [. v+ C" U5 p* z8 ]& Q
% U2 u& H$ O* S
User-agent: *$ h9 H6 U. ~! Z, n9 m
Disallow: /9 f- ^6 s6 T1 h1 m- C9 {7 y6 d7 T
. w5 b8 H+ g+ V0 s5 ?3 i: o
保存,然后丢进你的网站http根目录里。
- b' G- C! ]$ V7 M9 E
% W& B* J" n h/ u6 \* v( @# ~7 C完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
" O1 `( n9 L3 {0 K$ g/ ]. v6 w8 P' @2 [4 T2 P6 f2 q% a
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题! ~. x, W8 |# O" ~) E* d8 b
D' P* m7 v5 C9 ~" ^$ Z' U$ CUser-agent: *
+ h: R" ~! u2 J5 b7 b. S8 wDisallow: /bbs: F/ @) u9 u' V
. f% {! q5 B' G) E! i9 {6 Z
可以了!
! v8 F% I1 u! T2 ?4 g2 d4 q
" A% ~; ~& O! m再来个例子:# z( K' B( V* ]( [$ \/ _/ u
$ A1 s) x8 k. A9 A H3 B3 ]! oUser-agent: *: l/ c# C' {9 I& I9 _
Disallow: /pub0 E) ~. ^( ?6 q' i/ X0 i( \: V
Disallow: /img
" b. x( M& d0 M. r) o- f- p& y7 l- YDisallow: /cgi-bin% W" Z* m# p1 ~" B5 g; u
Disallow: /forum
% ?* I$ [. c4 {8 V- W9 @+ ?) }Disallow: /shop
" d" j: g1 C3 \# a% [* c$ M& Y" ?* ~3 s: k$ G/ x
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
& ~0 G- A% C2 u0 ^+ ^) d5 q i: Y7 c* I, g
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
' h, e& c$ C7 @' A' x, {$ x% f( D5 k4 Q7 t- q$ d7 V" S
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 6 e$ e4 x4 L' Y0 `/ }
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
; g1 t* N+ P6 {" v6 ]) M! t7 K! E
9 T, k1 t; D+ z0 {9 _$ y, J[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|