关于google搜索结果中只有链接,没有标题和摘要的东东

[ 2007-11-10 16:14:15 | 作者: Admin ] 字号: | |
今天分析了一下google搜索结果中只有链接,没有标题和摘要的部分,发现主要有以下几类:

1.网站写了robots协议,搜索引擎不能抓取,为了保证搜索结果的准确性,google就会根据超链分析把链接放出来。这种的东东google是不给快照的。如: 民生银行 。其robots文件内容:

User-agent: *
Disallow: /

2.网站成为了死链(或者在google更新时成为了死链),但是google还会在搜索结果中保留一段时间。这种网站google一般不给快照。如:qq驿站 

qq.com.cn/
类似网页

3.google只收录了这个链接,但是还未将页面的内容建到索引中。这是最常见的一种,这种情况google也是不给快照的。如 杨千桦
ting.cococ.com/Music_Column.Asp?Music_id=8579&Music_index=0.1.5236
类似网页

4.多个url指向同一个网页(动态url比较常见),google会只给其中一个url标题与摘要,其余的只给链接。这种情况一般不会給出快照,如venom site:post.baidu.com

post.baidu.com/f?kw=venom 
post.baidu.com/f?kw=venom&t=1
post.baidu.com/f?kw=Venom&t=1
这三个链接最终都会链接到同一个页面,google就只收录其中一个url的页面并给出快照与摘要,其他的两个只收录链接,但是不收录页面,也不给快照。

5.使用了较复杂的跳转技术,google暂时无法识别。google一般会给出快照,但是一般这种页面存在跳转,如http://www.timistudio.com/,他用javascript设定如果浏览者的分辨率为800或者1024会分别进入不同的页面。

6.这是一个多媒体格式文档,google部分无法别的文档也是同样情况,最常见的就是swf文档,如:刘德华 filetype:swf

[FLASH] 61.187.56.24/dmt/1001743394%5B1%5D.swf
类似网页

当然也不是所有的swf类文档都没有摘要,有一些google已经能识别并提取出swf文档中的文字,如:

[FLASH] 已下载量下载进度字节总量% ...
文件格式: Shockwave Flash
已下载量下载进度字节总量% 爱护花草原来是你最可爱 ANDY LAU EMAIL : samalon@263.net
HTTP:// yzkfc.myetang.com SAMALON 精彩制作PLAY 肯德基餐厅前方30 M 刘德华演唱会<P
ALIGN="LEFT"><FONT FACE="Arial" SIZE="10" COLOR="#FFFFFF"><A HREF="http://yzkfc ...
music.jl.cninfo.net/mtv/01070608.swf - 类似网页

总的来说可以分为两大类:一类是google只收录链接,没有收录内容的;一类是google收录了内容,但是无法提取出内容的。以后有机会再补充一下,感觉好象还有其他的情况。
Share
评论Feed 评论Feed: http://www.85815.com/feed.asp?q=comment&id=60
UTF-8 Encoding 引用链接: http://www.85815.com/trackback.asp?id=60&key=
这篇日志没有评论.
发表
表情图标
[smile] [confused] [cool] [cry]
[eek] [angry] [wink] [sweat]
[lol] [stun] [razz] [redface]
[rolleyes] [sad] [yes] [no]
[heart] [star] [music] [idea]
UBB代码
转换链接
表情图标
悄悄话
用户名:   密码:   注册?
验证码 * 请输入验证码