聚类分析论文提纲

2022-11-15

论文题目:函数型聚类分析方法及其应用研究

摘要:聚类分析是多元统计分析的一个分支,也是数据挖掘中十分常用的一种分析方法。在传统的聚类分析中,无论分析的数据是横截面数据、时间序列数据还是面板数据,聚类分析的对象通常是采集的离散数据点,相对应的数据处理方式以向量的形式呈现。伴随着信息技术的高速发展,尤其是传感器的普及以及存储技术的飞跃发展,许多领域的数据都呈现出海量性、连续性的特点,数据之中包含着许多动态的信息,这一类数据通常被视作函数型数据。针对函数型数据,传统的聚类分析在聚类的过程中难以衡量数据的动态变化特征,因此提出了函数型聚类分析。相比传统的聚类分析,它将数据看作是一个整体,从函数的视角出发,在聚类的过程中挖掘了数据更多的动态信息。对于具有函数特性的数据,函数型聚类分析方法能够达到更好的聚类效果。基于函数型聚类分析方法的优点,越来越多的学者开始使用函数型聚类分析方法,并对其进行深入的研究与拓展。本文通过对现有函数型聚类分析方法以及传统聚类分析方法的梳理和研究,发现目前函数型聚类分析方法研究的主要方向是基于函数型数据相似性度量的研究,并指出目前函数型聚类分析方法研究中存在的主要问题—基于数值距离或曲线形态的单一角度来衡量函数型数据相似性的问题。为了解决这种单一性问题,本文提出了一种同时兼顾函数型数据的数值距离与曲线形态的相似性度量方法—基于极值点偏移补偿的相似性度量,并将其与现有几种函数型数据的相似性度量方法进行了对比,通过可视化展现更加清晰的区别了各种方法的特点。为了更加满足实际需求,本文尝试将单指标函数型聚类分析方法拓展至多指标函数型聚类分析方法(函数型熵权法)。为了验证方法的有效性,本文分别使用传统的聚类分析方法、基于数值距离的函数型聚类分析方法、基于曲线形态的函数型聚类分析方法以及本文提出的兼顾数值距离与曲线形态的函数型聚类分析方法对上证50样本股的进行聚类,并使用轮廓系数对各方法的聚类结果进行比较,得出如下结论:无论单指标函数型聚类分析方法还是多指标函数型聚类分析方法,聚类分析的效果都优于传统的聚类分析方法;进一步,本文提出的基于极值点偏移补偿的相似性度量,确实达到了同时测度函数型数据的数值距离与曲线形态的效果,使用这种相似性度量进行函数型聚类分析,聚类分析的效果也得到了提升!

关键词:函数型聚类分析;B样条基;多指标函数型数据;函数型熵权法;欧氏距离

学科专业:应用统计学(专业学位)

摘要

ABSTRACT

第一章 绪论

第一节 选题背景及选题意义

一、选题背景

二、选题意义

第二节 文献综述

一、传统聚类分析方法研究现状

二、函数型聚类分析方法研究现状

三、研究现状的述评

第三节 本文研究思路与框架

一、研究思路

二、研究框架

第四节 本文的创新点

一、函数型聚类分析方法中相似性度量的创新

二、多指标函数型聚类分析方法的拓展研究

三、函数型熵权法的提出

第二章 函数型数据分析(FDA)概述

第一节 函数型数据结构

一、单指标函数型数据结构

二、多指标函数型数据结构

第二节 函数型数据预处理

一、基函数的选择

二、系数向量的估计

第三章 函数型聚类分析方法

第一节 基于数值距离的函数型聚类分析方法

一、基于基函数距离的函数型聚类分析方法

二、基于基函数展开系数距离的函数型聚类分析方法

第二节 基于曲线形态的函数型聚类分析方法

一、基于基函数导数相似性度量的函数型聚类分析方法

二、基于极值点相似性度量的函数型聚类分析方法

第三节 基于数值距离和曲线形态的函数型聚类分析方法

一、基于极值点偏移补偿相似性度量的函数型聚类分析方法

二、几种相似性度量方法对比的实例

第四节 多指标函数型数据聚类分析方法拓展研究

一、多指标面板数据的聚类分析方法

二、多指标函数型数据的聚类分析方法

第四章 上证50成分股的实证分析

第一节 上证50样本股价格曲线聚类分析

一、单指标数据拟合

二、聚类模型及其参数选择

三、聚类方法性能对比

四、聚类结果可视化对比

第二节 上证50样本股量价双指标曲线聚类分析

一、双指标数据拟合

二、聚类模型参数选择及其性能对比

第五章 总结与展望

第一节 总结

第二节 展望

参考文献

附录1

附录2

致谢

上一篇:会计制度变迁利益冲突论文提纲下一篇:成长感悟论文提纲