20xx年国内视频搜索引擎分析报告
一,背景
互联网正在经历着飞速发展的时代,在过去短短的几年里互联网从以telnet,email为代表的粗陋文本时代,一跃发展为丰富的宽带多媒体时代。互联网基础设施的快速改善,使我们今天不仅可以通过互联网欣赏到丰富多彩的图文内容,还可以进行视频通讯和网络游戏。
网络视频做为一个行业进入人们的视野是从美国Youtube的奇迹开始的,随之便一发而不可收,仅20xx年以来,中国互联网行业如雨后春笋一样涌出300多家网络视频企业,相当于平均每周诞生2家,网络上的视频数量也已成爆炸式增长。
在线搜索服务超越电子邮件,已成为今天网民最常用的互联网应用。视频搜索定将成为搜索引擎服务业新的竞争点。
二,分析对象
国内的视频搜索引擎服务商几乎都是近1年内出现的,大体可分为门户类和专业类两种。而多数搜索引擎技术却大同小异,这些视频搜索引擎是否能够满足视频用户日趋增加的需求?现在已经完善到什么程度?未来会向哪些方向发展?让我们共同体验有可能成为引领此番网络视频革命的先驱们。
谷歌(/)
9月21日正式对外发布。有热门、幽默、娱乐、体育、音乐和动画六大栏目。并对当天100大视频进行排行。 百度(/)
汇集了几十个在线视频分享网站的视频索引资源而建立。
Leexoo(http://www.Leexoo.com/)
雷搜视频搜索引擎今年8月初推出测试版,是目前世界上唯一一款基于视觉特征分析技术的视频搜索引擎。该引擎在搜索结果中以多个图片方式提供了视频摘要,使用户可以更加直观地选择要观看的视频。该款视频搜索引擎除了提供文字搜索视频的服务外,还第一次推出了图片搜索视频和视频搜索视频的服务。该搜索引擎同时提供在线视频、手机视频、P2P视频搜索等不同类型视频的搜索服务。
Openv(http://www.Openv.com/)
于20xx年3月推出,采用英国Autonomy公司的视频搜索技术,目前有包括央视、滕讯搜搜、新华网在内的多家合作搜索站点,号称电视视频搜索全球第一。
Pcpie(http://www.Pcpie.com/)
于20xx年底推出,号称有国内最大的视频数据量。
搜狗(/)
搜狐网旗下的视频搜索引擎,支持Flash视频搜索和在线观看。
爱问(http://v..cn/)
新浪网旗下的视频搜索引擎,支持Flash视频搜索和在线观看,以站内视频搜索为主。
雅虎(http://video./)
搜索结果均来自于同一个视频网站,所以不计入分析队列。
搜搜(/)
搜索技术和搜索结果均套用Openv的数据,所以不计入分析队列。
三,分析
为了更好的对以上具有代表性的视频搜索引擎有个更深入的了解,现以一些网民和行业共同关注的数据对其进行评测,举例说明。
1,搜索结果数量:
方法:通过在几个网站输入“美女”、“搞笑”、“nba”等常用视频搜索关键字,统计其返回的实际有效搜索结果数(通过一直向下翻页,去掉重复结果)。结果数愈多,代表搜索结果越丰富。
谷歌:标注结果与可显示结果数不符,平均搜索结果量约1000。 百度:标注结果与可显示结果数不符,平均搜索结果量约2000。 Leexoo:平均搜索结果量约40000。
Openv:标注结果与可显示结果数不符,平均搜索结果量约1100。 Pcpie:标注结果与可显示结果数不符,平均搜索结果量约3500。 搜狗:标注结果与可显示结果数不符,平均搜索结果量约2000。 爱问:标注结果与可显示结果数不符,平均搜索结果量约1000。
小结:Leexoo的数据相比而言更真实。虽然网民对于搜索结果很少翻到10页以后,但是这绝不说明搜索引擎可以肆无忌惮的狂编出几百万的虚构数据,再者,对于内容表现更为丰富且更加强调娱乐性的视频而言,用户对传统文本搜索结果很少翻到10页以后的这一行为习惯也正在改变。总之,对搜索引擎服务商而言,也许你们索引库有很多内容,但是你们还是应该按照用户能看得到的内容数目告诉用户。
2,搜索内容丰富:
方法:通过在几个网站输入“输入法”、“螺丝”、“autocad”等非常用视频搜索关键字,统计其返回的实际有效搜索结果数。结果数愈多,代表搜索结果越丰富。
谷歌:标注结果与可显示结果数不符,平均搜索结果量约300。 百度:标注结果与可显示结果数不符,平均搜索结果量约800。 Leexoo:平均搜索结果量约20。 Openv:平均搜索结果量约30。
Pcpie:标注结果与可显示结果数不符,平均搜索结果量约30。 搜狗:标注结果与可显示结果数不符,平均搜索结果量约400。 爱问:标注结果与可显示结果数不符,平均搜索结果量约200。
小结:这个结果可见传统大公司的实力和积累。百度不愧是中文第一搜索引擎。Pcpie,Openv,Leexoo的规模还是比较小。
3,搜索结果信息丰富程度和用户体验 支持的用“Y”表示,不支持的用“N”表示
比较项目 谷歌 视频代表图片 Y Title Y
N 描述信息
N 格式
N 大小
Y 时长
视频上网时间 N 视频观看次数 N
N 视频预览
视频摘要帧 Y
小结:
百度 Y Y N N N N N N N N Leexoo Openv Y N Y Y Y Y Y N Y N Y N Y N Y N Y Y Y N Pcpie
Y Y N N N N N N Y N 搜狗 Y Y N N N N N N N N 爱问 Y Y N N N Y Y N N N
1、
从这张表,可以看出来各个视频搜索的技术特点,传统文本搜索引擎服务商,对视频的搜索结果,仍是以文本表现方式为主,几乎都不提供更能体现视频内容特点的视频预览和视频摘要,反而是Leexoo这种新兴的以视频处理技术见长的小公司,更能在搜索结果中体现视频本身的特点。 2、
这张表,反映出不同视频搜索引擎服务商对于用户在视频搜索方面的体验的把握程度。网络视频以用户上传为主,其文本描述信息极为简单甚至没有,或者干脆“文不对题”。而传统文本搜索引擎服务商,仍是以擅长的文字表现为主,但由于搜索结果中不能体现视频内容特征,主导用户点击行为的仍然是排序。而Leexoo这种新兴的视频搜索服务商,由于其结果中对于每一个视频结果均给出了7帧摘要帧图片,以及一段视频的预览,用户可以不必通过文本,直接通过图片以及视频预览片断可以更直观地选择视频。显然,这种方式对视频搜索用户而言更加友好,更加直观,颠覆了传统文本搜索所建立的按照排序来点击搜索结果的用户行为习惯。 3、
百度等搜索引擎甚至连视频的文本描述信息都没有给出来。 4、
传统文本搜索引擎服务商在视频搜索的技术和用户体验方面,落后于新兴的服务商。业内传言,百度甚至没有自己的视频搜索蜘蛛,只是每天向各个视频网站索要其视频索引信息来提供搜索服务,从结果来看,有一定的依据。
4,搜索准确性和有效性:
通过输入不同关键词的搜索结果进行分析。
谷歌:根据视频内容的文本信息(标题、说明、标签等)进行分类显示。显示最相关的结果,而省略了部分与已显示的结果相似的条目。 百度:根据视频内容的文本信息进行分类显示。
Leexoo:通过对视频内容的视觉特征和文本信息分析而显示出相应的结果。准确率颇高。 Openv:通过Autonamy的技术在电视类视频的搜索上有很高准确率。 Pcpie:通过测试,准确率不是很高,远没有达到号称按帧搜索的精度。 搜狗:根据视频内容的文本信息进行分类显示。 爱问:根据视频内容的文本信息进行分类显示。
小结:Leexoo的视频特征分析技术在视频搜索上占有了绝对的优势。Openv则依靠Autonamy的语音识别技术在电视类视频上取得了领先。其他的搜索引擎则只能依靠对标签等文字信息的分析进行检索。Pcpie号称“帧搜索”而实际精准度却很难说服大众。
5,可搜索的视频分类。
支持的用“Y”表示,不支持的用“N”表示
比较项目 在线视频 手机视频 P2P视频 谷歌 Y N N 百度 Y N N Leexoo Openv Y Y Y N Y N Pcpie
Y Y N 搜狗 Y N N 爱问 Y N N
小结:视频搜索引擎应该是广义的对互联网上所有的视频文件进行搜索的引擎。而不是窄意的只对以flash视频为代表的在线视频的搜索。Leexoo对互联网上三大类视频都做了索引。
Pcpie只对手机视频和在线视频加以区分,其他搜索引擎依然最基本的搜索格式。
6,搜索来源广泛性
通过输入不同“site:网址”或通过关键词查询组合进行分析。
谷歌:内容来源约20个。
百度:内容来源约40个。
Leexoo:内容来源约70个。
Openv:内容来源约70个。
Pcpie:内容来源约30个。
搜狗:内容来源约40个。
爱问:内容来源约40个。
小结:Leexoo在全国号称有300余家视频网站中收录了约1/4,基本功颇为扎实。Openv的内容来源分为电视类视频和网络类视频两部分,其电视类视频占总视频来源大约2/3。其他搜索引擎则基本在一个水平线上,唯有谷歌刚刚步入视频搜索这个行列,该做的事还真的很多。
7,特色功能
谷歌:
1,搜索结果支持rss订阅。
2,视频内容的评级和举报。
3,部分视频内容具有缩略图功能。
百度:
1,搜索结果矩阵显示,每页多达20个。
2,内容较为全面的视频专题。
Leexoo:
1,搜索结果支持视频片段预览。
2,搜索结果提供按内容变换而截取的7个预览图片。
3,搜索结果去除部分重复视频。
4,提供图片搜索视频及视频搜索视频服务。
5,提供不良视频举报功能。
Openv:
1,搜索结果支持矩阵和列表两种显示方式。
2,搜索结果支持视频片段预览。
Pcpie:
1,首页有搜索和门户两种模式。
2,提供放映大厅和上传视频服务。
搜狗:
1,搜索结果矩阵显示,每页多达20个。
2,搜索关键词排行榜。
3,支持在结果中搜索功能。
爱问:
1,搜索结果支持按相关性和按时间排序两种显示方式。
2,搜索结果提供搜索视频和搜索专辑两种选项。
小结:显示样式和排序方式的变化已不足以区分搜索引擎有何质的改变,所以多数搜索引擎其实都处于同一档次上。其中谷歌的搜索结果支持rss订阅是一个创新,但不会成为其领先于其他搜索引擎的技术壁垒;Pcpie的头像搜索也仅仅是个初级的模型,并没有真正的使用。视频和文本的最大不同就在于视频是非结构化的数据,能否做到脱离标题,标签等具有诱惑性的说明而直接去对实质内容进行分析,并给网民以真实的反馈,这将成为搜索引擎质变的门槛。真正具有质变潜质的是Leexoo,搜索结果提供按内容变换而截取的7个预览图片,说明了其技术可以做到按视频内容进行搜索,而提供图片搜索视频及视频搜索视频服务则是进一步证明了此能力。
8,界面友好程度
谷歌:默认搜索结果页面占据页面显示面积上部的1/4来做自己的栏框,即使有“收起”和“移除”选项,也显得是那么不的协调。用户有时候不能直接完整观看视频,需要下拉。
百度:页面清晰,整洁。搜索列表页面每页最多显示20个视频内容并显示一帧概况图。
Leexoo:页面清晰。既延续了传统的搜索引擎显示样式,又突破性的开拓了符合视频展示的方式。
Openv:页面清晰,分类明确。
Pcpie:页面清晰,分类详细。
搜狗:页面清晰,整洁。搜索列表页面每页最多显示20个视频内容并显示一针概况图。
爱问:搜索结果分两列显示,侧重于页面左侧。
小结:搜索引擎是个内容的入口,一般给人以清晰,简单的感觉即可。在这方面几大搜索引擎都有各自的优势。百度和搜狗的页面样式非常相似,简单又清晰;Leexoo的按视频内容截取的7个关键帧显示方式比较有特色;Openv和Pcpie的分类比较准确和详细。但是谷歌在这方面做的还不够好,不像是Google这个品牌做的,有点像个人站长做的,不够大气。爱问最好也适当调整版面。
9,用户体验
谷歌:UI粗糙,内容较少。不太符合谷歌这种大品牌的定位。
百度:内容较丰富,页面简单,相信这两点赚了不少印象分。但是对内容的描述信息不够全面。
Leexoo:是一个可以改变用户习惯的视频搜索引擎。使用户的焦点不再是按自上而下的顺序寻找所关注的内容。而是全面的概览后直接选取所需,节省了大量时间,从而提高搜索效率。其图片搜索视频和视频搜索视频服务还有待观察。 Openv:电视类视频专题做的颇具特色。首页的电视墙做得很眩,不过实际用处不大,反而因此令首页打开较慢。 Pcpie:翻页条在右侧别具一格。搜索准确度有待提高。
搜狗:同百度一样的样式,区分在于各自的品牌实力。
爱问:新浪播客的视频占据了绝大多数,更多是新浪的站内视频搜索。
小结:除去做电视类视频搜索的Openv不说,目前用户体验最好的是百度和搜狗。最有竞争潜力的是Leexoo。其搜索结果以视觉特征方式展现,提供视频的摘要帧图片和视频预览片断的方式,,有可能会改变用户对视频搜索结果的浏览习惯,这是非常具有创造性的。不过Openv在1年半时间更换了4次网页风格,Pcpie在不到1年时间内更换了4次网页风格。这对于用户体验来说,不是个很好的做法。
10,更新频率
方法:通过列举最新发生的热点视频,观察被搜索引擎收录的时间,来统计视频搜索引擎的更新频率。
谷歌:1天 百度:2天 Leexoo:1天 Openv:1天 Pcpie:至少3天以上 搜狗:2天以上 爱问:1小时
小结:视频搜索引擎的基本更新频率是1天,Leexoo、Openv、谷歌都做到了这个平均值,爱问确实表现颇为出色,而大于1天的则需要努力了。
11,技术实力
支持的用“Y”表示,不支持的用“N”表示
比较项目 谷歌
Y 文本搜索视频
图片/视频搜索视频 N 内容采集的智能抓取 Y
N 视觉特征索引
视频概念和段落识别 N
N 视频自动分类
N 自动聚合和查重
有害视频检测过滤 N
百度 Y N N N N N N N Leexoo Openv Y Y Y N Y N Y N Y N Y N Y N Y N Pcpie 搜狗
Y Y N N Y N N N N N N N Y N Y N 爱问
Y N N N N N N N
小结:由于视频搜索和文本搜索的本质不同,按照文本搜索的模式来做视频搜索肯定是不对的。Leexoo由于掌握了视频搜索所要求的基本技术,所以获得了领先优势,并且是门槛级的优势,谷歌等传统搜索引擎还有很多待于完善。Openv和Pcpie迈出了一小步,由此更加证明了视频搜索是具有技术门槛,需要有真实实力的产品。
12,支持格式
基本都是以flv为主,并包括目前网上主流的视频格式rm, rmvb, wmv, asf, mpg, mpeg, avi,3gp,mov等。
13,被文本搜索引擎收录的情况(site:) Google 谷歌:45 百度:20,900 Leexoo:7,350 Openv:6,820 Pcpie:72,500 搜狗:80,100 爱问:383,000 百度 谷歌:12
百度:402,000
Leexoo:4,350
Openv:184
Pcpie:73,300
搜狗:138
爱问:109
小结:所有视频搜索引擎从被收录的网页数量上看,google的文本搜索引擎收录的明显大于百度
Pcpie在搜索引擎优化(SEO)方面下了功夫,在两大文本搜索引擎中,表现相对不错。
Gogole文本搜索引擎对自己的视频搜索引擎只收录了区区45个,可被评为20xx年度最无私的企业。而百度正好相反,胳膊肘绝不外拐,不知道是技术水平与google有差距?还是出于商业策略的考虑。
14,视频搜索排行榜
谷歌:提供每天更新的前100个搜索排行。
百度:无搜索排行榜
Leexoo:提供两种排行:一是将视频自动分为9类,提供这9类视频中每天最热门的视频排行榜;二是整合9大热门视频网站的搜索排行榜。
Openv:提供12种类型的分类排行榜。
Pcpie:无搜索排行榜
搜狗:无搜索排行榜
爱问:无搜索排行榜
小结:作为一个全网的视频搜索引擎来讲,能站在全视频行业角度去对视频内容,网民搜索行为进行分析,是最基本的要求。最直观的外在表现就是视频搜索排行榜。现只有三家提供视频搜索排行榜:谷歌对当天的搜索内容进行排行,稍显不够全面。Leexoo的排行相对不错。Openv提供的搜索排行榜偏向于电视类媒体,这正是他们的强项。
还有些其他参数在这里就不详细一一列举。
四,总结
谷歌:目前在其搜索网站上没有什么体现视频搜索方面的新技术,据说,Google的视频采集爬虫尚处于初级阶段,需要针对每一家视频网站开发专门的采集器。
与.COM的Google视频搜索相比,可是被阉割的厉害,甚至连提交收录视频网站的最基本功能都没有,做个除了搜索什么功能都没有纯粹的“视频搜索引擎”。而说到搜索,最可笑的是谷歌连自家Google Video以及Youtube的视频内容都不收录。如此疲于赶场式的谷歌视频搜索,真是让所视频搜索用户贻笑大方。
百度:目前在其搜索网站上没有什么体现视频搜索方面的新技术,其视频索引主要来自于各个视频网站每天直接给百度的贡献——百度还没有自己的网络视频爬虫。百度曾跟Autonomy合作,希望采用后者的技术,但是后者同时是Openv的核心技术提供商。最近传闻,百度还在四处寻找和采购新的视频搜索与分析技术。
没有过多的修饰,没有过多的步骤,一切从简。
Leexoo:从网络视频爬虫、采集、分析到索引,拥有全线核心技术,发展潜力比较大。 或许不是最大的,但绝对是最有潜力的,因为技术实在高出一截,因为对视频的理解确实够深刻。
Openv:视频搜索引擎技术来自国际上领先的非结构化搜索技术提供商Autonomy,但是,Autonomy的技术是对音频的分析,对于视频搜索引擎还不存在缺陷,同时,Openv在网络视频的爬虫技术上还是空白。另外,由于核心技术受制他人,难以保证及时响应中国互联网视频搜索用户的需求。事实上,Openv已经更多的转变为一个面向电视台的搜索技术服务提供商+视频分享网站。
电视视频与网络视频的结合,是一大特点,到底能有多大市场,还有待于时间检验。
Pcpie:具有视频分享网站类似的广告模式,具有视频搜索引擎相近的功能。号称按帧搜索,结果比标签搜索还不准确。在视频搜索领域里尚缺乏核心竞争优势。值得一提的是技术研发团队在哪里,似乎是海外?????
搜狗:虽然与百度基本相同,但是在结果中的二次搜索功能可以很方便的把搜索结果再次细分,搜狗的技术特点体现在了细微之处,可谓用心良苦。
爱问:包括热门推荐、最新上传等等。爱问视频搜索并不是要做视频搜索引擎,而是想以“视频搜索”吸引用户过来尝试,再以此为基础创建一个视频分享的社区。
目前来看,最好的视频搜索是百度,其在内容、用户体验、页面等方面占据优势,这得益于其在国内文本搜索领域里的统治地位。但是致命的弱点是其未能突破文字搜索转换成视频搜索的技术门槛,在视频搜索领域缺乏最基本的技术支撑。可以预见未来的视频搜索行业中,Leexoo将会是最强有力的竞争者,其是以对视频特征分析的技术构建行业壁垒,提高搜索精准度,进而影响用户体验。搜索引擎是以技术为主导的产品,Leexoo已经具备颠覆视频搜索行业的基本潜质。
20xx年视频行业呈现了超强的发展势头,20xx年视频网站之间的竞争变得越发激烈,而视频搜索引擎的对决会为时不远,谁能更好的满足网民的需求,谁又能引领视频搜索行业的方向性发展。让我们拭目以待,不过还是先祝愿大家都尽情发挥自己的优势,一路走好。