首页 | 信息中心 | 网络学院 | 远教厂商 | 培训考察 | 资源中心 | 市场研究 | 行业媒体 | 国际远教 | 网上书城 | 杂志订阅
远教沙龙 | 群英会 | 案例分析 | 名家评论 | 人物专访 | 人才中心 | 专家专栏 | 2006 历届大会:05'04'03'02' | 网友投稿 | BBS
厂商动态
应用案例
 
 厂商类别: 远程教育综合运营商和总体解决方案 软件支持领域 资源库支持领域 硬件支持领域 其它 

网梯、清华联手研发影视内容检索


一年后,由北京网梯科技发展有限公司和清华大学计算机科学与技术系的智能技术与
系统国家重点实验室智能多媒体组合作研发的“影视检索原型系统”将呈现在大家面前。

  一位朋友参加了远程教育的学习,有时候为了寻找一次相关课程的视频课件要费很大周折,但这样还不一定能找到。沮丧之余,她有些“异想天开”:“要是有个网站能像Google搜索文字那样直接搜索视频多好啊!”当记者告诉她,这不是幻想,一个这样的系统很快就要面世的时候,朋友的嘴张成了“O”字型,表示难以置信。诚然,如果先前有人说这样的话,记者也会觉得有点不可思议,然而就在不久前记者得知,一年后,由北京网梯科技发展有限公司和清华大学计算机科学与技术系的智能技术与系统国家重点实验室智能多媒体组合作研发的“影视检索原型系统”将呈现在大家面前。目标是这样确定的,但是对于合作双方来说,这次联手显然是个艰巨的挑战。

  从信息检索“奥运会”脱颖而出

  其实早在几年前,美国政府就已经组织展开了影视内容检索的研究工作。清华智能技术与系统实验室教授兼“影视检索原型系统”项目负责人林福宗介绍说:“TRECVID(影视检索评估)是影视检索领域中的国际性权威评测,得到美国多个政府部门的支持,并由美国国家标准技术研究所(NIST)组织实施,中国科学院有学者把它称为信息检索(IR)中的‘奥运会’”。之所以将其称为信息检索中的“奥运会”,是因为有全世界众多著名的大学、包括IBM在内的跨国公司以及研究机构参加。几年来,欧洲、澳洲、美洲以及亚洲等各大洲都有多个国家参与测评,我国香港、台湾、上海等地也均有大学及公司参与,仅2005年全球就有68个不同国家和地区的大学及公司参加。“美国标准技术研究所向世界各国参评的大学和公司发布标准测试数据,让参评者用这些数据测试自己开发的算法和软件,并在规定时间以前提交自己的运行结果,然后由标准技术研究所提供标准答案并对各结果进行评估。”2001年,该研究所首次在TREC(文本检索会议)中加入影视检索的子项目。由于影视检索的重要性,2003年影视检索发展成为独立的评估项目,并且每年举行一次测评。

  去年,清华智能技术实验室正式参加影视检索项目的测评。具有多年检索研发经验的清华智能技术与系统实验室,从上个世纪九十年代就已经开始了图像内容检索和文本检索的研究,在国际国内发表了多篇水平较高的论文,培养了多名优秀的博士生和硕士生,文本检索小组还多次参加TREC的评估,取得了很好的成绩。

  “要做就要做得最好”,这是林福宗教授对小组成员常说的一句话。“只有做得比别人好,才能证明自己的创造性和研究水平。”

  在日以继夜的艰苦努力下,清华智能多媒体组首次参加2004年国际影视检索评测就取得了优异的成绩。在镜头边界检测子任务的共三项评测指标中,他们取得了总效果第一、渐变镜头检测第一和突变镜头检测第三的好成绩;在高层特征检测子任务中又取得了篮球进篮单项评测第一的好成绩。同时小组成员还在国际会议上发布了7篇学术论文,在国内期刊发表了1篇论文,其中还有3篇被SCI检索收录、2篇被EI检索收录。“这些论文都是由小组的学生成员完成的,其中不乏年轻的本科生和硕士生”,林福宗赞许地说。

  在前三届影视检索所有子任务的测评中,前三名都被IBM Watson研究中心和卡耐基·梅隆大学(CMU)等这样的著名大学和研究机构所垄断,而清华智能多媒体组去年在不到5个月的时间里就组织参加了两个子任务的测评,并在参赛的44个单位中脱颖而出,这充分证明了清华大学在智能多媒体研究领域中的能力。

  初战告捷,清华智能多媒体组决定一路走下去,2005年,他们又组织参加了影视检索测评中的全部四个子任务:镜头边界检测、低层特征抽取、高层特征抽取以及搜索。

  从研究到开发知难而进林

  福宗教授曾听说过这样一个故事,国内某知名电视台某次在其库存录像光盘中寻找一份重要的历史录像,但由于多年来积累的库存量太大,花了很长时间竟然没有找到,最后不得不以高价从国外购买。此事的真实性虽然并未得到证实,但还是给清华智能多媒体组成员以很大的震动:“如果当时影视检索系统成熟了,寻找这盘录像简直就是一件轻而易举的事情。”小组成员们更加坚定了开发影视检索系统的决心。但是,长期以来,清华大学的很多项目都仅仅停留在研究阶段,除了部分课题因为研究时间、市场接受度以及国家体制等原因暂时无法投入应用,很多项目都是因为资金的不足而没有投入应用开发。

  智能多媒体组不希望影视检索系统也遭受同样的待遇,“影视检索一旦开发出来并投入实际应用,前景十分广阔,其适用范围之广泛能够解决人们诸多不便,节省大量时间”。因此,在研究之余,林福宗和他的战友们也在寻找着合作方,希望把研究的成果应用到开发上,他们简洁地称之为从R(Research)到D(Design)。对于清华智能多媒体组来说,这是一个寻找的过程,但是对于后来的投资方网梯公司来说却不是这样,他们玩笑地将自己与清华的此次合作行动称为一个“预谋”。

  “一直以来我们都很关注检索领域的研发,在参与影视检索项目之前,我们就已经开发了远程教育课程全文检索系统,对上载到服务器的课件文件进行一系列文档格式的全文搜索。由于与清华大学智能技术实验室有多年的合作关系,我们很快就得知他们在研究影视检索系统,而这正是我们所关注的。”

  一旦得知,就要紧紧抓住。网梯公司对影视检索十分感兴趣并且非常看好其前景,公司总经理张震当即决定投资该项目并进行设计开发。2005年4月8日,双方正式签订了合作协议,共同约定,通过一年的时间,按照TRECVID中针对检索的评估指标,要设计和开发出整体达到国内领先水平、在某些方面达到甚至超过国际现有水平的影视检索原型系统。

  网梯是国内较早涉足远程教育业务并已在远教市场占有一席之地的公司,长期以来他们始终致力于远程教育技术的开发。为了使自己的产品保持强有力的竞争优势,网梯一直都在关注新技术的研发和应用。如今网梯公司依然把焦点放在远程教育方面:“在远教领域有很多视频课件,需要的时候如果逐一进行寻找将是一项无比庞大的任务,有了影视检索以后就会完全不一样。所以我们将首先开展远程教育领域的影视检索开发。”除此之外,网梯公司还计划将该检索系统的开发设计扩大到企业应用和web TV等众多领域。

  作为当前国际上的热点研究问题,影视内容检索是一片尚未开垦的处女地,其涉及范围之广、检索内容之多、研发难度之大,使得项目任务显得格外艰巨,“尤其是用文字和数字来描述电视图像内容非常困难。例如,一座房子、一个具体的人,用人类的语言都很难描述出来,计算机就更难理解了。”尽管如此,面对影视检索的巨大应用前景,清华智能多媒体组和网梯公司还是知难而进,决定坚持到底。■

清华大学智能技术与系统国家重点实验室

  实验室1987年7月开始筹建,1990年2月通过国家验收,并正式对外开放运行。实验室由中心实验室及智能信号处理、智能图形图像处理、人机交互与媒体集成三个分室组成,主要从事人工智能基本原理、基本方法的基础与应用基础研究,包括智能信息处理、机器学习、智能控制,以及神经网络理论等,还从事与人工智能有关的应用技术与系统集成技术的研究,主要有智能机器人、声音、图形、图像、文字及语言处理等。这些研究方向是国际同类研究的前沿,有多学科交叉、技术综合等特色,对科技与经济的发展有十分重要的意义。

  自建成以来,实验室承担了许多国家级的重大基础与应用基础研究项目,取得了一批重要研究成果。它们或者具有较高的理论水平和潜在的应用价值,如人工智能的问题求解理论及应用、形式语义学、模糊逻辑、量子计算、地球物理信号处理与识别方法及其应用、智能装配机器人、自主式移动机器人和临场感技术等;或者兼具学术研究与工程应用两方面的重要价值。

清华大学智能技术与系统国家重点实验室智能多媒体组

  智能多媒体组成立于1997年,一直致力于将计算技术、认知科学、人工智能和多媒体技术等学科融合在一起,并开展计算和人机接口方面的研究工作。

  智能多媒体组的目标是开发有实用价值的理论和工具,目的是使机器不仅能够响应我们的命令,而且将来也能够理解我们的情感。当前该组的研究工作主要集中在机器学习、粒度计算、图像内容检索、影视内容检索、多媒体搜索引擎和数字水印等研究课题方面。

 
 
 
 
 
 
 
网站地图 工作机会 友情链接 团队风采 在线调查 广告服务
地址:北京市海淀区魏公村路2号中央广播电视大学学习中心大楼11层1107室 邮编:100081 
电话:010-58840286 传真:010-58840287