量化投资:MATLAB数据挖掘技术与实践(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第2篇 技术篇

本篇是本书的主体,系统地介绍了数据挖掘的相关技术及这些技术在量化投资中的应用实例。这部分内容又分为如下三个层次。

(1)数据挖掘前期的一些技术,包括数据的准备(数据的收集、数据质量分析、数据的预处理等)和数据的探索(衍生变量、数据的统计、数据可视化、样本选择、数据降维等)。

(2)数据挖掘的六大类核心方法,包括关联规则、回归、分类、聚类、预测和诊断。对于每类方法,详细介绍了其包含的典型算法,包括基本思想、应用场景、算法步骤、MATLAB实现程序,同时对每类方法,还介绍了一个在量化投资中的应用实例,以强化这些方法在量化投资中的实用性。

(3)数据挖掘中特殊的实用技术,包含两章内容,一是关于时序数据挖掘的时间序列方法,二是关于优化的智能优化方法。这个层次也是数据技术体系中不可或缺的技术。时序数据是数据挖掘中的一类特殊数据,因为金融数据往往具有时序性,所以针对这类特殊的数据类型,又介绍了时间序列方法。数据挖掘离不开优化,量化投资也离不开优化,所以又介绍了两种比较常用的智能优化方法——遗传算法和模拟退火算法。

本篇包括10章,各章要点和特色如下。