作战2000论坛
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
[打印本页]
作者:
Newbie
时间:
2004-11-30 19:20
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
不知道发到哪儿~~权当灌水吧~~咔咔
1 M, J" r: ^4 b$ `
& p7 B2 l' K- \2 h+ y
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
0 v. S. r" p- U) s. V/ X- b$ ]
9 Z( x5 L) a* N: |. ~' C
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
" d, r! k6 W" o3 }! U8 I
8 G* R1 ]- b3 R e5 R4 p. A2 C: _
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
4 B/ [( o$ {) c% G Q' l& l* O6 h
8 W2 ~6 r$ O& c2 ^
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
, |4 `! o/ l5 p w1 E/ l- s5 h" s
% {' N/ Q; t! F/ N
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+
http://www.googlebot.com/bot.html)
"
. ^3 c- C# n1 r1 P, S3 e0 y* N! g
8 U) f0 }" n7 P- D0 t# m+ f
就是说,Robot报告的东西就是Google能查到的。
8 ^) ~/ W- `$ {' |
. b, a9 ~) N( }1 F$ L
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
4 p& r3 H! q( M) L* }
, ~* I; h/ Z. d$ r9 l z E
废话说了介么多,好啦好啦,进入主题!怎么做?
$ U) G6 j( q/ |, D4 s D- J' ]
' n( w* k) x% ]
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
0 T: Y: t% D3 V7 r v
8 `1 k. Q0 d: @7 P5 K+ Y$ ~
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
8 A) |! E/ I3 u4 j: G) H
8 i# I+ F! i7 s) A
把下面两行贴进去,当然你要一个字一个字打偶也不反对
0 O* v/ J! a9 q' s; F
5 U R8 g% h5 D) r5 U9 `! g" M3 l
User-agent: *
4 g B$ q5 ^; u- I; I+ o
Disallow: /
1 b8 p( O; T" w) F9 U
4 Y' x# d- y) y3 s9 }# q' o
保存,然后丢进你的网站http根目录里。
# E; `6 _/ g& U- X7 P* S" o7 w
! O( q% `3 U. F! t# V$ l
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
8 l! _, y: h6 ~& h) ]( H) E
6 b5 E% d, e; c" y. l0 W
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
) P! X% b4 O) k6 ^. T2 l. b& _
- g* D- m4 x( e* ^) r# D! V n) e
User-agent: *
3 ]/ _' Y5 n M0 v o6 y/ x- s
Disallow: /bbs
$ E( A0 |# Y# @3 V) h
7 D* Q) H( k& \- K
可以了!
6 D+ J" m: _5 O& e
i9 F% ~) O, l C( ^; V6 p+ B* i
再来个例子:
# L [- w$ D% {! ^1 O5 C
3 W) L0 j: o G6 M) d$ E
User-agent: *
c3 _8 T! i8 e* y, N/ Y
Disallow: /pub
0 G! l! N- J1 s
Disallow: /img
" I# V7 z4 G* o$ l k) d1 x( P0 ~
Disallow: /cgi-bin
- o2 D5 B& j7 M% \' P% S- K
Disallow: /forum
$ { b3 V) ?2 M/ ~& J4 {6 P
Disallow: /shop
. N2 E- P# ~* A* D* v
3 G! h) N5 J) Y- y) Z0 w! ]
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
2 t% v4 J1 H+ U5 N& C
5 R5 L# |7 z1 a1 s6 D3 G
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
+ N% ]0 w. q7 y4 S1 D7 q$ c! L9 r) Y
) n* ^; D- T: u
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
+ _+ u7 H* w% R( j. b' b+ G
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
' R8 w/ L7 a: f- e8 d G d
3 B% c' Y4 P4 f& v9 Z
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
作者:
HADES1974
时间:
2004-12-1 10:52
好东西,这阵风过去就又可以恢复回来了
欢迎光临 作战2000论坛 (http://www.combat2000.cn/)
Powered by Discuz! X3.2