|
不知道发到哪儿~~权当灌水吧~~咔咔 & D# D# Q$ b% u7 J0 e/ p
: Q# X6 D! q2 H1 }+ R0 N
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
- r* @$ c* a/ L/ M9 b3 a7 W2 B1 `% g7 t, n8 `$ G5 G
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
5 E" L* I! m: Q% h- \% ], ?) ?- f# x1 _7 ^% t2 V
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
) k k; K0 j( r8 s
1 J5 p/ J$ U* b; x, ~Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:7 |$ T, ^1 J: |' b/ V. l: J9 U: R
# j: ]5 A4 B$ c. R- Y' {4 o4 d, y% ]
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
+ n7 m- d v8 }& n7 U4 p2 ]. ?- H; o& I K% ?( n% y
就是说,Robot报告的东西就是Google能查到的。6 v! H5 m9 N4 [' y \
; L% X" C5 p+ p$ B, z, d此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
3 F& O6 y! b! V- n$ K: _; W9 A; U* ~2 k
废话说了介么多,好啦好啦,进入主题!怎么做?; Z8 F: T, b3 B8 v
6 Z, B `6 o9 R
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
. C4 X. b2 a% \' b: d4 {$ d( Z; S# Y( F5 P
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说# E- t @8 {# A9 e% U7 N: N1 c
- I: G" r+ A* p5 ~8 ]# B) k
把下面两行贴进去,当然你要一个字一个字打偶也不反对
! y8 q8 N8 Y( x+ `
( l. v0 w* d! L wUser-agent: *
' Z( H6 C6 |: Y3 K3 P$ L% e- HDisallow: /
: |+ W) O/ y, t/ n( m$ H! _) h% Q1 z- L1 J
保存,然后丢进你的网站http根目录里。: }/ ?5 `4 ]2 Z1 y; E1 H# p
% B8 U! \: H& Z m/ {
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了+ {0 n& ]2 a* d2 S8 g
8 u' |9 F9 g/ f: [( q* ?
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
* y) l& p3 P9 ]" t! m( N7 j
5 m# S6 C) V9 `( sUser-agent: *
- i3 {) Z9 E+ DDisallow: /bbs, W4 [; G7 c" y: i
5 s2 X( R; f: J i) w R8 H可以了!
$ I2 L- _) v. \1 C" k6 W5 f' k' _1 C7 D0 p" ^( |4 e! Y
再来个例子:
. T* j( J- F X& _/ Z' Q! n% C6 s- z; ]9 ~: O
User-agent: *3 e$ h: v2 c- _1 s- K, l7 O
Disallow: /pub3 x& w+ U2 Z# B8 e8 `1 A
Disallow: /img
1 m6 r2 {9 G) K. c2 V mDisallow: /cgi-bin
& P% h! H3 E8 k S0 ~Disallow: /forum6 X2 k5 G# y, }7 R
Disallow: /shop
2 q9 n' j, h% X+ `5 r+ d0 l
# D) Q6 g H5 E看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~ l0 b1 \8 T/ h& g# ^
6 t3 P8 |' f' Z' k最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
. ^% l: \$ z2 j5 g
; I( L6 I9 ~/ Sps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 " O: `2 M F. R7 n) O9 L6 J
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 % N, |" L) |; Q0 F6 {; P$ K4 U, |/ L
{5 Z0 d& @$ [* h# {* R) X
[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|