当前位置:七七学习网文章资讯毕业论文毕业论文提纲本体支持的视频语义概念探测» 正文

本体支持的视频语义概念探测

[06-22 10:24:36]   来源:http://www.77xue.com  毕业论文提纲   阅读:8651
概要:3.1 文本匹配文本匹配通过计算概念描述文本与视频片段包含的文本之间的相似性来判断视频片段包含该概念的可能性大小。视频中包含的文本信息一方面来自于视频伴随音轨中的语音信息,另一方面来自于视频中字幕、场景文字的识别,即VOCR。本文采用ScanSoft 公司开发的Nuance 系统[6](前身为IBM 公司开发的ViaVoice 引擎)作为语音识别工具和人工方法辅助视频伴随音轨文字标注视频中的语音信息;新闻视频中的字幕包含了对视频内容的主要文本描述,因此在本文的研究中只考虑字幕文本的识别而不考虑场景文字的识别。本文采用郭金林等[7]提出的基于压缩域特征的字幕定位与文字识别作为字幕文本识别工具。通过语音识别和VOCR 抽取的文本信息记作vt。采用中科院的开源分词软件ICTCLAS[8]进行中文分词,抽取vt 中包含的词条集1 { }Ni i nt nt = = 。对于英文分词采用人工标注方法处理。概念描述文本通过视频概念扩展本体中的定义获得,包括两个部分:一是概念描述d,d ∈D,
本体支持的视频语义概念探测,标签:论文提纲格式,毕业论文提纲范文,http://www.77xue.com

  3.1 文本匹配文本匹配通过计算概念描述文本与视频片段包含的文本之间的相似性来判断视频片段包含该概念的可能性大小。

  视频中包含的文本信息一方面来自于视频伴随音轨中的语音信息,另一方面来自于视频中字幕、场景文字的识别,即VOCR。本文采用ScanSoft 公司开发的Nuance 系统[6](前身为IBM 公司开发的ViaVoice 引擎)作为语音识别工具和人工方法辅助视频伴随音轨文字标注视频中的语音信息;新闻视频中的字幕包含了对视频内容的主要文本描述,因此在本文的研究中只考虑字幕文本的识别而不考虑场景文字的识别。本文采用郭金林等[7]提出的基于压缩域特征的字幕定位与文字识别作为字幕文本识别工具。通过语音识别和VOCR 抽取的文本信息记作vt。采用中科院的开源分词软件ICTCLAS[8]进行中文分词,抽取vt 中包含的词条集1 { }Ni i nt nt = = 。对于英文分词采用人工标注方法处理。

  概念描述文本通过视频概念扩展本体中的定义获得,包括两个部分:一是概念描述d,d ∈D,D 为本体中所有概念描述集合。另一个是概念同义词集SynonymsList 。对概念描述d 进行分词,从中抽取词条集,与同义词集合并组成概念描述词条集{ } 1Mj j c d c d == 。 www.77xue.com哦

  常用且效果较好的文本表示模型是向量空间模型[9]。在该模型中,文档空间被看作是由一组正交向量张成的向量空间,即把每一个文档看作是文档向量空间中的一个特征向量,该向量的每一个分量表示对应特征在该文档中的特征权值。对于中文文本而言,由于词条是语义最小的单位,因此一般选词条作为特征。特征通常根据词频和倒文档频率计算。根据文本向量空间模型的一般定义,本文计算视频概念C 描述文本与视频包含的文本之间的匹配程度,进一步,所有名词术语{ } i nt 具有越高的重要度乘积值,说明这两个文本集具有越高的相似度。vt,cd co 度量了两个文本集包含相同名词术语的程度,显然, vt,cd co 值越大,说明两个文本集的相似度越大。

  通过上述计算,可以度量每一个视频概念与待探测视频片段的文本匹配程度。某个概念计算得到的匹配程度越大,说明该视频片段包含该概念的可能性越大。

  3.2 本体概念匹配与文本匹配相同,抽取视频包含的文本集vt 和vt 中包含的名词术语集。通过匹配nt 与视频概念扩展本体中的概念定义,可以获得nt 对应的一个概念集合。直观的讲,C 中包含的概念在该段视频中出现的可能性较大。但是如何定量的度量某一个概念在vt 中拥有更重要的“地位”呢?即vt 的内容与该概念更加相关。

  在文献中,Resnik 提出了一种概念信息内容度量方法,即度量概念与文本内容的相关程度,具有高信息内容的概念具有高的相关程度。这一方法为我们解决度量概念在视频文本vt 中的重要程度(即二者的相关程度)提供了思路。本文提出的概念匹配方法如下:

  首先,对于概念i c ,通过视频概念扩展本体定义的关系,抽取与i c 相关的本体概念,这里定义“相关”概念为:在本体中与i c 语义距离不超过2 的概念和共现关系集中定义的与i c 具有共现关系的概念。语义距离定义为本体关系图中,两个概念间的最短路径包含的边数。

  不难理解,对于视频概念而言,其相关概念为其父节点概念、二级父节点概念和所有兄弟节点概念。标记与i c 相关的所有概念的同义词集的合集为( ) i RT c ,则可定义i c 在文本集vt 中的似然度。

  4 特征匹配特征匹配是从低层特征相似性的角度探测元概念,即建立视频低层感知特征与视频概念之间的关联。

  感知概念一方面具有一致的、容易学习的低层特征模式;另一方面,视频概念扩展本体定义的概念与感知概念间的关系赋予了感知概念一定的语义。相对于从视频中单纯抽取的低层感知特征而言,抽取感知概念具有的低层特征模式更能够表征元概念与低层特征的内在关联规律。视频概念是视频概念扩展本体中定义的语义粒度最小的概念,主要通过视觉特征表现。因此,本文讨论的特征匹配主要基于感知概念中的视觉对象概念。

上一页  [1] [2] [3] [4] [5]  下一页


Tag:毕业论文提纲论文提纲格式,毕业论文提纲范文毕业论文 - 毕业论文提纲

《本体支持的视频语义概念探测》相关文章

联系我们 | 网站地图 | 范文大全 | 管理知识 | 教学教育 | 作文大全 | 语句好词
Copyright http://www.77xue.com--(七七学习网) All Right Reserved.
1 2 3 4 5 6 7 8 9 10