Statistics Toolbox

多元统计

多元统计提供分析多个变量的算法和函数。典型应用包括通过特征转换与特征选择降维,使用可视化技术(如散点图矩阵和经典多维定标)探查变量间的关系。

使用主成分分析拟合正交回归 (示例)
实现 Deming 回归(总体最小二乘)。

特征转换

特征转换(有时称为特征提取)是一种将现有特征转换为新特征(预测元变量)而描述性特征下降较少的一种降维技术。该工具箱提供了特征转换的以下方法:

  • 非负矩阵分解当模型术语必须代表非负数量(比如物理量)时使用
  • 主成分分析 (PCA):用于通过投影到独特正交基底上汇总维度较少的数据
  • 因素分析用于构建数据关联的解释模型
偏最小二乘回归和主成分回归(示例)
在有高度相关的预测元的情况下,对应变量建模。

特征选择

特征选择是一种只选择建模数据时提供最强预测能力的测量特征子集(预测元变量)最强降维技术。当您处理高维数据或采集所有特征数据成本高昂时,这种技术非常有用。

特征选择方法包括:

  • 逐步回归依次增加或删除特征,直到预测精度没有改进为止;可与线性回归或广义线性回归算法一起使用。
  • 顺序特征选择与逐步回归类似,可与任何受监督学习算法和定制性能测量一起使用。
  • 规则化(套索和弹性网络)使用收缩估计量通过将冗余特征权重(系数)减至零消除冗余特征。

特征选择可用于:

为分类高维数据选择特征(示例)
为癌症检测选择重要特征。

多元可视化

Statistics Toolbox 提供可直观地探查多元数据的图形和图表,包括:

  • 散点图矩阵
  • 系统树图
  • 双标图
  • 平行坐标图
  • Andrews 图
  • 符号图
对显示年型如何影响不同变量的散点图矩阵进行分组
对显示年型如何影响不同变量的散点图矩阵进行分组。
显示主成分分析中前三个载荷的双标图。
显示主成分分析中前三个载荷的双标图。
显示原产国家/地区如何影响变量的 Andrews 图。
显示原产国家/地区如何影响变量的 Andrews 图。
下一页: 概率分布

试用 Statistics Toolbox

获取试用版软件

Machine Learning with MATLAB

观看网上技术交流会录像