多媒体信息网络论文提纲

2022-11-15

论文题目:关于互联网视觉媒体若干问题的研究和应用

摘要:随着互联网的飞速发展,越来越多的图片、视频和文字等多媒体信息被大量的上传到互联网。其中,图片和视频作为能高效地提供直观视觉效果的媒体,在社交网络中更是成为了最为活跃的一类信息载体。基于互联网视觉媒体的信息处理是指运用当前网络上存在的大量图片/视频等媒质,以及这些媒质所附带的标注、评论、用户喜好等信息,进行多源异质的媒体信息分析、处理及应用。其研究内容涉及到计算机图形学、计算机视觉以及机器学习等多个领域,目的是充分利用现有的视觉媒体资源,开发出适应用户需求的智能应用。 基于上述背景,本文在具体应用中若干关键问题的驱动下,运用图像处理和计算机视觉中相关方法与技术,将互联网上多种视觉媒体资源进行智能整合和多样化重现,研究了以下三个方面的内容:多模态艺术化的图像渲染;皮影戏中人脸图像渲染和视频动画交互;面向家具风格的特征提取和视觉分类。本文的主要研究内容及创新之处概述如下: 1、提出了融合文字信息的多模态图像艺术化渲染方法,并设计实现了Picwords系统; 图像的艺术化渲染是将图像风格抽象化和艺术化的图像处理技术。本文提出了一种全新的图像艺术化渲染方法,将图片和文字两种模态所携带的语义信息进行有机融合,以丰富原图的语义信息。该方法利用原图像的主体结构关联低频信息和整体效果,同时将文本进行几何形变并作为重构目标的高频细节信息,进而完成图片和文字两种模态的视觉融合。基于上述方法,本文设计并实现了多模态图像渲染系统Picwords。该系统将输入图像及其相关的关键词融合进同一张图片中,同时对关键词的权重进行了自动调整。该系统输出结果最大限度地保持了图像的整体视觉效果,并传达了更多语义信息,在海报设计、广告宣传和社交网络中都有得到广泛的应用; 2、提出了面向皮影戏的人脸艺术化渲染方法和动画交互方法,并设计了皮影戏遗产电子化保护系统; 为了保护中国皮影戏这一宝贵的非物质文化遗产,本文设计了一个面向皮影戏的遗产电子化系统。该系统包括皮影戏创作模块和皮影戏操作模块,旨在利用网络上与皮影戏相关的图片和视频等视觉媒体资源,将皮影戏的创作个性化,操作简洁化。其创作模块根据用户提供的人脸图片,通过人脸渲染方法生成个性化的皮影戏头像并保持皮影戏人物的特点。操作模块可通过动画交互方式将皮影的表演动作的操作转化为由脚本命令进行控制,在保持了皮影戏表演特点的同时,简化了操作的复杂度。该系统可有力辅助皮影戏这一文化遗产的保护和传承。 3、提出了基于深度学习并融合传统图像分类的家具风格图片分类方法; 家具风格是家具最具判别力的外观视觉特征。利用该特征进行家具风格的智能挑选与推荐,可提升现代家居生活质量,兼具学术与应用价值。传统的目标分类和家具的风格分类的不同之处在于:前者是以家具的结构和功能作为分类依据;而后者更注重发掘和分析家具细节上的不同,如花纹、材料、颜色等。本文对此展开了以下工作:首先,根据目前家具市场的风格选择需求,建立了家具风格的图像数据集,这也是第一个针对家具风格研究而建立的视觉数据集;其次,分别比较了传统的图像分类方法和基于深度神经网络的图像分类方法在家具风格分类上的性能,并提出了多尺度的图像卷积特征;最后,在深度学习的基础上融合传统图像分类方法,对16类家具风格分类进行实验(分类正确率达到了70%)并对实验结果进行了深入分析。

关键词:多媒体信息处理;互联网视觉媒体;非真实感图像渲染;中国皮影戏;面部渲染;动画技术;家具风格;图像分类;特征提取;卷积神经网络

学科专业:信号与信息处理

致谢

摘要

ABSTRACT

插图清单

表格清单

第一章 绪论

1.1 研究背景和意义

1.2 多媒体视觉信息处理简介

1.3 国内外发展现状

1.3.1 基于内容的图像/视频检索

1.3.2 视觉媒体的数据库

1.3.3 视觉媒体合成

1.3.4 视觉媒体编辑

1.4 研究的内容与主要工作

1.5 论文的组织结构

第二章 视觉媒体处理的关键技术

2.1 视觉媒体的艺术画渲染技术

2.1.1 基于笔画的渲染

2.1.2 基于区域的渲染

2.1.3 基于样本的渲染

2.2 视觉特征提取

2.2.1 颜色特征

2.2.2 LBP特征

2.2.3 SIFT特征

2.2.4 彩色SIFT特征

2.2.5 HOG特征

2.3 图像分类方法

2.3.1 传统的图像分类方法

2.3.2 基于深度学习的图像分类方法

2.3.3 卷积神经网络

2.4 总结

第三章 多模态图像渲染系统

3.1 引言

3.2 系统介绍

3.2.1 图像模块

3.2.2 关键词模块

3.2.3 图像文字融合模块

3.2.4 后处理模块

3.3 实验

3.3.1 定量实验

3.3.2 定性实验

3.3.3 计算效率

3.4 结论

第四章 皮影戏的遗产电子化:创作和操作

4.1 引言

4.2 皮影戏生成模块

4.2.1 人脸对齐

4.2.2 眼部卷绕

4.2.3 侧影线的生成

4.2.3.1 侧影线提取

4.2.3.2 侧影线纹理转移

4.2.4 后处理

4.3 皮影戏操作模块

4.3.1 控制模型

4.3.2 运动系统

4.3.3 动画生成

4.3.3.1 权重选择

4.4 实验

4.4.1 创作模块结果

4.4.2 操作模块结果

4.4.2.1 元动作平滑

4.4.2.2 动画整体平滑

4.4.2.3 合成皮影戏短视频

4.4.3 皮影戏故事

4.5 结论和展望

第五章 家居风格的视觉分类

5.1 引言

5.2 家具风格数据库

5.3 家具风格分类

5.3.1 基于手工的特征

5.3.2 基于学习的特征

5.3.2.1 基于家具风格数据库的CNN模型

5.3.2.2 基于预训练的CNN模型

5.3.2.3 多尺度的CNN模型

5.3.3 手工特征和基于学习的特征结合

5.4 分类实验

5.4.1 手工特征的分类结果

5.4.2 基于学习的特征的分类结果

5.4.3 手工特征和学习特征联合分类结果

5.5 总结和展望

第六章 总结和展望

6.1 本文总结

6.2 研究工作展望

参考文献

上一篇:课堂教学中体态语论文提纲下一篇:初中语文教学运用论文提纲