毕业论文提纲：本体支持的视频语义概念探测

时间：2017-08-31 我要投稿

1 引言视频语义内容分析的目标是抽取视频包含的高层语义内容，为用户提供语义概念的视频浏览、检索服务，语义概念探测是实现这一目标的核心步骤，并成为近期视频语义内容分析领域的重要研究方向。

　　以往的视频概念探测主要采用基于内容的方法，即通过抽取概念具有的低层特征，学习某种关联模型（基于规则的或是基于统计机器学习的），直接的、独立的建立低层特征与概念之间的关联，探测视频概念。

　　基于规则的方法是在抽取特征的基础上，对特征进行简单或者复杂的阈值判定。这种关联模型的缺点是阈值确定难、算法不鲁棒，并且简单的阈值判断难以有效的表征概念具有的特征多样性。因此，目前采用较多的是基于统计机器学习的关联模型，即通过某个机器学习模型学习标注的样本数据中低层特征与视频概念之间的统计概率关联模式，然后采用训练好的机器学习模型对新的样本进行识别，探测视频概念。目前的研究表明，支持向量。

　　和最大熵模型（Maximum Entropy Model，简称MEM）是两类较为有效的用于概念探测的机器学习模型。

　　但是，由于语义鸿沟的存在，低层特征和高层语义的关联并不是一一对应。不同的视频概念可能具有相似的低层特征，相同的视频概念也可能具有完全不同的低层特征，基于内容的独立概念探测方法难以克服这个问题。另一方面，视频中的概念并不是独立出现的，不同的概念总是同时出现在视频帧序列中。显然，不同概念的共现性将增加低层特征模式的复杂性，进而影响独立的概念探测性能。但是，从另外一个角度思考，不同概念间的关系信息也为概念探测提供了重要的上下文信息，例如：包含“汽车”概念的视频片段，具有很大的可能包含有“道路”概念。重要的是如何有效的建模和利用这些信息。

　　针对语义概念探测存在的困难，本文提出了本体支持的视频语义概念探测方法。一方面通过定义中层语义以减小语义鸿沟，建立低层特征与高层语义关联的桥梁；另一方面利用概念间的关系和上下文语境，在概念探测中加入语义线索，提高概念探测器的语义识别能力。

　　而本体作为合适的知识建模工具可以有效的描述视频语义内容和建模领域知识，因此利用本体增强概念探测的语义表达和识别能力是必需的也是可行的。

　　2 本体支持的概念探测框架视频内容跨越了低层感知特征、感知特征模式、简单语义概念、复杂语义概念诸多层次，并不是简单的特征层和语义层就能表示的；更为重要的是，这种层次结构建立了视频内容从低层特征到高层语义的内在关联过程，为跨越语义鸿沟提供了有效途径。另一方面，视频语义内容分析的本质就是各个层次内容的分析抽取和各个层次之间关联的建立。

　　基于以上分析，定义感知概念和语义概念如下：

　　定义 1 感知概念 (Perception Concept)感知概念是视频中特征相似、反复出现的感知特征模式的抽象。这里的低层感知特征模式指视频流中具有相同视觉或听觉特征模式的时序或空间分割，例如：具有相同颜色特征的区域、具有相同音频特征的视频片段等，是语义概念在低层感知特征空间中最基本的表征。

　　定义 2 语义概念 (Semantic Concept)语义概念对应视频中的特定时间片段或空间区域。语义概念是用户分析视频内容时关心的基本概念；从低层特征上看，语义概念具有明显的、容易区别的低层感知特征模式，能够表现为一个感知概念或多个感知概念和其关系的组合。

　　在上述概念定义的基础上，提出视频领域知识本体和视频概念扩展本体建模上下文信息和视频低层特征与高层概念的关联关系。

　　定义视频领域知识本体（Video Knowledge Ontology，简称VKO）为一个二元组，表示视频领域知识中的概念的集合和概念间关系的集合。概念表示为一个五元组：名称、标签、关系集、同义词集、描述文本；概念间语义关系包括四类：Kind ? of 关系、Instance ? of关系、Part ? of 关系、Attribute ? of 关系。需要指出的是，在实际知识建模过程中，概念间的关系不限于上述定义几种基本关系，可以根据目标领域的具体情况定义相应的关系。

　　其中，VLO （Video Linguistic Ontology），表示视频概念扩展本体中的语言层本体，即视频内容中的语言级概念和概念间关系的集合。这里的语言级概念对应于视频内容层次结构模型中定义的视频概念。

　　VPO（Video Perception Ontology），表示视频概念扩展本体中的感知概念层本体，即视频内容中感知特征层中蕴含的感知特征模式和其关系的集合。

　　语义概念的探测应该从两个方面进行考虑。一方面是发现概念具有的低层特征模型，称为特征匹配。感知概念的抽象和定义建立了低层特征和视频概念两个层次之间的中间语义，避免直接建立低层特征和视频概念间的关联，减小语义鸿沟问题带来的影响。从低层特征角度看感知概念是低层特征模式的抽象，具有特征稳定性和一致性；从高层语义角度看，视频概念总是表现为若干感知概念的组合，因此感知概念也具有一定的语义。因此，首先抽取视频概念关联的感知概念，然后从感知概念中抽取低层特征训练统计机器学习模型，识别语义概念。

　　另一方面是建模并利用上下文信息增强概念探测方法的语义理解和识别能力，称为上下文信息匹配。提出的视频概念扩展本体的语言层定义了概念之间的关系，同时“概念描述”、“同义词集”、“关联概念”等概念描述属性完整、准确的描述了概念包含的上下文信息。

　　同时，利用VOCR 和语音识别技术可以从视频片段中抽取文本信息，这些文本信息中出现的概念术语为语义概念探测提供了语义线索，能够增强概念探测的准确率。本文提出的本体支持的概念探测方法。

毕业论文提纲：本体支持的视频语义概念探测相关推荐