哪些网站可以做视频搬运海南在线招聘
- 作者: 五速梦信息网
- 时间: 2026年03月21日 10:20
当前位置: 首页 > news >正文
哪些网站可以做视频搬运,海南在线招聘,WordPress怎样交换友链,十大外包公司排名【数学建模】《实战数学建模#xff1a;例题与讲解》第十一讲-因子分析、聚类与主成分#xff08;含Matlab代码#xff09; 基本概念聚类分析Q型聚类分析R型聚类分析 主成分分析因子分析 习题10.11. 题目要求2.解题过程3.程序4.结果 习题10.21. 题目要求2.解题过程3.程序4.结… 【数学建模】《实战数学建模例题与讲解》第十一讲-因子分析、聚类与主成分含Matlab代码 基本概念聚类分析Q型聚类分析R型聚类分析 主成分分析因子分析 习题10.11. 题目要求2.解题过程3.程序4.结果 习题10.21. 题目要求2.解题过程3.程序4.结果 本系列侧重于例题实战与讲解希望能够在例题中理解相应技巧。文章开头相关基础知识只是进行简单回顾读者可以搭配课本或其他博客了解相应章节然后进入本文正文例题实战效果更佳。
如果这篇文章对你有帮助欢迎点赞与收藏~
基本概念
多元分析Multivariate Analysis是一种涉及多个变量的统计分析方法是数理统计学中的一个重要分支。这种分析方法的内容丰富而复杂具有独特的视角和多样的方法。在工程技术领域多元分析由于其实用性和灵活性深受工程技术人员的喜爱。它在许多工程领域都有广泛的应用比如在产品质量控制、风险评估、设计优化等方面都发挥着重要作用。
多元分析的核心在于同时考虑多个变量之间的相互关系。传统的统计分析方法通常只考虑一个或两个变量之间的关系但在实际问题中多个变量之间的交互作用往往对结果有着决定性的影响。因此多元分析通过考察变量之间的这种复杂交互能够提供更加全面和深入的洞察。
此外多元分析在处理大规模数据集时显示出其独特的优势。随着计算机技术的发展和数据采集能力的提高工程师和研究人员现在能够收集和分析以前无法想象的数据量。多元分析方法能够有效处理这些大数据揭示数据中隐藏的模式和趋势从而帮助决策者做出更加明智的决策。
聚类分析
聚类分析通常可以分为Q型和R型两种。Q型聚类分析关注于样本的分类而R型聚类分析则侧重于指标的分类。
Q型聚类分析
Q型聚类分析是一种将样本根据它们之间的相似性进行分组的方法。这种方法特别适用于那些需要将个体或观测值分为不同组或类别的情况。在这种分析中相似性通常是通过计算样本之间的距离来衡量的。距离越小样本间的相似性越高。
例如在市场研究中Q型聚类可以帮助识别具有相似购买行为或偏好的消费者群体。这种分析可以帮助企业更有效地针对特定群体进行营销和产品开发。
R型聚类分析
R型聚类分析则是根据不同指标或变量之间的相似性来对它们进行分类。这种方法适用于寻找哪些变量或指标彼此之间联系紧密能够共同表征某一现象或过程。
在经济分析中R型聚类可能用于识别哪些经济指标通常同时变化从而可以共同用于分析经济趋势或政策影响。同样地在环境科学中R型聚类可以用来识别哪些环境因素共同影响生态系统的健康和稳定性。
主成分分析
主成分分析PCA是一种统计技术用于简化数据集。它通过减少数据集的维度同时尽可能保留原始数据中的变异性来实现这一目的。PCA 在多个领域中都非常有用特别是在处理具有多个变量或特征的复杂数据集时。
工作原理
数据预处理PCA 开始于将数据标准化以便每个变量的贡献权重相等。协方差矩阵计算接着计算数据的协方差矩阵。协方差矩阵帮助识别数据中变量间的相关性。特征值和特征向量然后计算协方差矩阵的特征值和特征向量。特征向量代表了数据的主成分方向而特征值则表明了这些方向上的变异量。降维最后根据特征值的大小选择几个最重要的特征向量以降低数据集的维度。这些主成分捕捉了最多的数据变异性。
因子分析
因子分析FA是另一种数据降维技术经常用于调查研究和心理测试。与 PCA 类似因子分析旨在识别影响观测变量的潜在变量即因子。
工作原理
探索性因子分析EFAEFA 的目的是探索数据以识别潜在的因子结构。它不依赖于预先设定的模型。验证性因子分析CFA与 EFA 相反CFA 是基于先前假设的因子结构来验证数据的。因子提取通过不同的数学方法如主轴因子法或最大似然法从观测变量中提取因子。因子旋转为了使解释更加清晰通常会进行因子旋转。这有助于使因子更容易被理解和解释。
习题10.1
- 题目要求 2.解题过程 解 用 i 1 , 2… , 27 i1,2…,27 i1,2…,27 表示京津冀、山西、 … … …、新疆27个省、自治区 x j ( j 1 , … , 5 ) xj(j1,…,5) xj(j1,…,5) 分别表示指标变量城市规模城市首位度、城市指数、基尼系数、城市规模中位值。 1数据标准化 用 a i j a{ij} aij 表示第i个省第j个指标变量的取值。 首先将各指标值 a i j a{ij} aij 转化为标准化指标值 b i j a i j − μ i s j ; i 1 , 2 , ⋯ , 27 ; j 1 , ⋯ , 5. b{ij}\,\,{\frac{a{ij}-\mu{{i}}}{s{j}}}\,;i\,\,1\,,2\,,\cdots,27\,;j\,\,1\,,\cdots,5. bijsjaij−μi;i1,2,⋯,27;j1,⋯,5. 其中 μ j \mu{j} μj 是第j个指标的样本均值 s j sj sj 是第j个指标的样本标准差 μ j 1 27 ∑ i 1 27 a i j \mu{j}\,\,{\frac{1}{27}}\sum{i1}^{27}a{ij} μj271i1∑27aij s j 1 26 ∑ i 1 27 ( a i j − μ j ) 2 ( j 1 , 2 , ⋯ , 5 ) s{j}\,\,\sqrt{\frac{1}{26}\sum{i1}^{27}\,\left(\,a{i j}\,-\,\mu{j}\right)^{2}\,}\,\,(\,j\,\,1\,,2\,,\cdots,5\,) sj261i1∑27(aij−μj)2 (j1,2,⋯,5) 2计算27个样本点彼此之间的距离构造距离矩阵 d i k ∑ j 1 5 ( b i j − b k j ) 2 d{i k}~~{\sqrt{\sum{j1}^{5}\,\left(\,b{i j}\,-\,b{k j}\right)^{2}}} dik j1∑5(bij−bkj)2 使用最短距离法来测量类与类之间的距离 D ( G p , G q ) min i ∈ G p , k ∈ G q ∣ d i k ∣ D(G{p},G{q})\;\;\operatorname*{min}_{i\in G_p,k\in Gq}\left|d{ik}\right| D(Gp,Gq)i∈Gp,k∈Gqmin∣dik∣ 3 构造27个类每一个类中只包含一个样本点每一类的平台高度均为零。 4 合并距离最近的两类为新类并且以这两类间的距离值作为聚类图中的平台高度。 5 若类的个数等于1转人步骤6否则计算新类与当前各类的距离回到步骤4。 6 绘制聚类图根据需要决定类的个数和类。 3.程序 求解的MATLAB程序如下 clc, clear% 名称 ss {京津冀, 山西, 内蒙古, 辽宁, 吉林, 黑龙江, 苏沪, 浙江, …安徽, 福建, 江西, 山东, 河南, 湖北, 湖南, 广东, …广西, 海南, 川渝, 云南, 贵州, 西藏, 陕西, 甘肃, …青海, 宁夏, 新疆}; % 数据 a [699.70, 1.4371, 0.9364, 0.7804, 10.880; …179.46, 1.8982, 1.0006, 0.5870, 11.780; …111.13, 1.4180, 0.6772, 0.5158, 17.775; …389.60, 1.9182, 0.8541, 0.5762, 26.320; …211.34, 1.7880, 1.0798, 0.4569, 19.705; …259.00, 2.3059, 0.3417, 0.5076, 23.480; …923.19, 3.7350, 2.0572, 0.6208, 22.160; …139.29, 1.8712, 0.8858, 0.4536, 12.670; …102.78, 1.2333, 0.5326, 0.3798, 27.375; …108.50, 1.7291, 0.9325, 0.4687, 11.120; …129.20, 3.2454, 1.1935, 0.4519, 17.080; …173.35, 1.0018, 0.4296, 0.4503, 21.215; …151.54, 1.4927, 0.6775, 0.4738, 13.940; …434.46, 7.1328, 2.4413, 0.5282, 19.190; …139.29, 2.3501, 0.8360, 0.4890, 14.250; …336.54, 3.5407, 1.3863, 0.4020, 22.195; …96.12, 1.2288, 0.6382, 0.5000, 14.340; …45.43, 2.1915, 0.8648, 0.4136, 8.730; …365.01, 1.6801, 1.1486, 0.5720, 18.615; …146.00, 6.6333, 2.3785, 0.5359, 12.250; …136.22, 2.8279, 1.2918, 0.5984, 10.470; …11.79, 4.1514, 1.1798, 0.6118, 7.315; …244.04, 5.1194, 1.9682, 0.6287, 17.800; …145.49, 4.7515, 1.9366, 0.5806, 11.650; …61.36, 8.2695, 0.8598, 0.8098, 7.420; …47.60, 1.5078, 0.9587, 0.4843, 9.730; …128.67, 3.8535, 1.6216, 0.4901, 14.470]; % 使用zscore函数对矩阵a进行标准化处理 % zscore函数将每列的数据进行标准化使其均值为0标准差为1 % 标准化可以将不同变量之间的尺度差异消除使得它们具有可比性 b zscore(a) % 使用pdist函数计算标准化后的矩阵b的成对距离 % pdist函数可以计算多维数据点之间的各种距离默认情况下pdist函数计算欧氏距离 d pdist(b) % 使用linkage函数进行层次聚类分析 % linkage函数将距离矩阵作为输入计算聚类之间的链接 % 它返回一个连接矩阵z该矩阵描述了层次聚类的结构 z linkage(d) % 绘制树状图 dendrogram(z, label, ss);4.结果 从聚类图可以看出苏沪、京津冀、青海各自成一类其余省和自治区成一类。 习题10.2
- 题目要求 2.解题过程 解 用 x 1 , x 2 , … , x 5 x_1,x_2,…,x_5 x1,x2,…,x5 分别表示投资效果系数无时滞投资效果系数时滞一年全社会固定资产交付使用率建设项目投产率基建房屋竣工率。 用 i 1 , 2 , … , 17 i1,2,…,17 i1,2,…,17 分别表示1984年1985年… 2000年第i年第j个指标变量 x j x_j xj 的取值记作 a i j aij aij 构造矩阵 A ( a i j ) 17 ∗ 5 A(a{ij}){17*5} A(aij)17∗5 。 1数据标准化 首先将各指标值 a i j a{ij} aij 转化为标准化指标值 b i j a i j − μ i s j ; i 1 , 2 , ⋯ , 17 ; j 1 , ⋯ , 5. b{ij}\,\,{\frac{a{ij}-\mu{{i}}}{s{j}}}\,;i\,\,1\,,2\,,\cdots,17\,;j\,\,1\,,\cdots,5. bijsjaij−μi;i1,2,⋯,17;j1,⋯,5. 其中 μ j \mu_{j} μj 是第j个指标的样本均值 s j sj sj 是第j个指标的样本标准差 a ~ j 1 17 ∑ i 1 17 a i j \tilde{a}{j}\,\,{\frac{1}{17}}\sum{i1}^{17}a{ij} a~j171i1∑17aij s j 1 16 ∑ i 1 17 ( a i j − μ j ) 2 ( j 1 , 2 , ⋯ , 5 ) s{j}\,\,\sqrt{\frac{1}{16}\sum{i1}^{17}\,\left(\,a{i j}\,-\,\mu{j}\right)^{2}\,}\,\,(\,j\,\,1\,,2\,,\cdots,5\,) sj161i1∑17(aij−μj)2 (j1,2,⋯,5) 2计算相关系数矩阵R R ( r i j ) 5 x 5 R\;\;(r{i j}){\mathrm{5x5}}\, R(rij)5x5 r i j ∑ i 1 17 a ~ k i ⋅ a ~ k j 17 − 1 , i , j 1 , 2 , ⋯ , 5. r{i j}\,\,{\frac{\sum{i1}^{17}\tilde{a}{k i}\cdot\tilde{a}{k j}}{17-1}},\;i,j\,\,1\,,2\,,\cdots,5. rij17−1∑i117a~ki⋅a~kj,i,j1,2,⋯,5. 3计算特征值和特征向量 计算相关系数矩阵R的特征值及对应的标准化特征向量 u 1 , u 2 , … , u 5 u_1,u_2,…,u5 u1,u2,…,u5 其中 u j ( u 1 j , u 2 j , ⋯ , u 3 j ) T u{j}(\,u{1j},u{2j},\cdots,u{3j})^{\mathsf{T}} uj(u1j,u2j,⋯,u3j)T 由特征向量组成5个新的指标变量 { y 1 u 11 x ~ 1 u 21 x ~ 2 ⋯ u 51 x ~ 5 , y 2 u 12 x ~ 1 u 22 x ~ 2 ⋯ u 52 x ~ 5 , ⋮ y 5 u 15 x ~ 1 u 25 x ~ 2 ⋯ u 55 x ~ 5 . \left{\begin{array}{c} y{1}u{11} \tilde{x}{1}u{21} \tilde{x}{2}\cdotsu{51} \tilde{x}{5}, \ y{2}u{12} \tilde{x}{1}u{22} \tilde{x}{2}\cdotsu{52} \tilde{x}{5}, \ \vdots \ y{5}u{15} \tilde{x}{1}u{25} \tilde{x}{2}\cdotsu{55} \tilde{x}{5} . \end{array}\right. ⎩ ⎨ ⎧y1u11x~1u21x~2⋯u51x~5,y2u12x~1u22x~2⋯u52x~5,⋮y5u15x~1u25x~2⋯u55x~5. 式中y1是第一主成分y2是第二主成分…y5是第五主成分。 4计算综合评价值。 主成分yj的信息贡献率 b j λ j ∑ k 1 5 λ k , j 1 , 2 , ⋯ , 5 b_{j}\frac{\lambdaj}{\sum{k1}^{5} \lambda{k}}\,,j\,1\,,2\,,\cdots,5 bj∑k15λkλj,j1,2,⋯,5 主成分y1、y2、…、yp的累计贡献率 α p ∑ k 1 p λ k ∑ k 1 5 λ k \alpha{p}\frac{\sum{k1}^{p} \lambda{k}}{\sum{k1}^{5} \lambda{k}} αp∑k15λk∑k1pλk 当ap接近于1 (ap 0.85,0.90,0.95) 时则选择前p个指标变量作为p个主成分代替原来5个指标变量从而可对p个主成分进行综合分析。 计算综合评分 Z ∑ j 1 p b j y j . Z\,\,\sum{j1}^{p}\,b{j}y{j}. Zj1∑pbjyj. 其中bj是第j个主成分的信息贡献率根据综合得分值就可以进行评价。 利用Matlab求得相关系数矩阵的前5个特征根及其贡献率如下表 序号特征根贡献率累计贡献率13.134362.686662.686621.168323.367086.053630.35027.003693.057240.22584.516297.573450.12132.4266100.0000 可以看出前三个特征根的累计贡献率就达到93%以上主成分分析效果很好。下面选取前三个主成分进行综合评价。前三个特征根对应的特征向量如下表 x1x2x3x4x5第1特征向量0.4905420.525351-0.487060.067054-0.49158第2特征向量-0.293440.048988-0.28120.8981170.160648第3特征向量0.5108970.433660.3713510.1476580.625475 由此可得三个主成分分别为 y 1 0.491 x ~ 1 0.525 x ~ 2 − 0.487 x ~ 3 0.067 x ~ 5 − 0.492 x ~ 5 , y 2 − 0.293 x ~ 1 0.049 x ~ 2 − 0.898 x ~ 4 0.161 x ~ 5 , y 3 0.511 x ~ 1 0.434 x ~ 1 0.43 x ~ 2 0.148 x ~ 4 0.625 x ~ 5 , \begin{array}{l}{{y{1}0.491\tilde{x}{1}0.525\tilde{x}{2}-0.487\tilde{x}{3}0.067\tilde{x}{5}-0.492\tilde{x}{5}\,,}}\ {{y{2}-0.293\tilde{x}{1}0.049\tilde{x}{2}-0.898\tilde{x}{4}0.161\tilde{x}{5}\,,}}\ {{y{3}~0.511\tilde{x}{1}0.434\tilde{x}{1}0.43\tilde{x}{2}0.148\tilde{x}{4}0.625\tilde{x}{5}\,,}}\end{array} y1 0.491x~10.525x~2−0.487x~30.067x~5−0.492x~5,y2 −0.293x~10.049x~2−0.898x~40.161x~5,y3 0.511x~10.434x~10.43x~20.148x~40.625x5, 分别以三个主成分的贡献率为权重,构建主成分综合评价模型为 Z 0.6269 y 1 0.2337 y 2 0.076 y 3 Z 0.6269y_1 0.2337y_2 0.076y_3 Z0.6269y10.2337y20.076y3 把各年度的三个主成分值代入上式可以得到各年度的综合评价值以及排序结果如下表 年代199319921991199419871990198420001995名次123456789综合评价值2.4464l.97681.11230.86040.84560.22580.05310.0531-0.2534 年代19881985199619861989199719991998名次1011121314151617综合评价值0.26620.52920.74050.77890.97151.1476-1.2015-1.6848 3.程序 求解的MATLAB程序如下 clc, clear gj [0.71, 0.49, 0.41, 0.51, 0.46; …0.40, 0.49, 0.44, 0.57, 0.50; …0.55, 0.56, 0.48, 0.53, 0.49; …0.62, 0.93, 0.38, 0.53, 0.47; …0.45, 0.42, 0.41, 0.54, 0.47; …0.36, 0.37, 0.46, 0.54, 0.48; …0.55, 0.68, 0.42, 0.54, 0.46; …0.62, 0.90, 0.38, 0.56, 0.46; …0.61, 0.99, 0.33, 0.57, 0.43; …0.71, 0.93, 0.35, 0.66, 0.44; …0.59, 0.69, 0.36, 0.57, 0.48; …0.41, 0.47, 0.40, 0.54, 0.48; …0.26, 0.29, 0.43, 0.57, 0.48; …0.14, 0.16, 0.43, 0.55, 0.47; …0.12, 0.13, 0.45, 0.59, 0.54; …0.22, 0.25, 0.44, 0.58, 0.52; …0.71, 0.49, 0.41, 0.51, 0.46]; gj zscore(gj); % 将矩阵 gj 进行标准化处理使得每一列的数据具有零均值和单位方差 r corrcoef(gj); % 计算矩阵 gj 的相关系数矩阵 r用于后续的主成分分析% 使用函数 pcacov 对相关系数矩阵 r 进行主成分分析 % 它返回三个输出变量 x、y 和 z分别表示主成分的系数矩阵、特征值和贡献率 [x, y, z] pcacov® % 生成一个与 x 大小相同的矩阵 f其中每个元素的值为主成分系数的符号 % 这样做是为了确保主成分方向一致 f repmat(sign(sum(x)), size(x, 1), 1); x x .* f % 将主成分系数矩阵 x 的每个元素与 f 对应位置的元素相乘以确保主成分方向一致 num 3; % 保留的主成分数量 df gj * x(:, 1:num); % 计算投资数据矩阵 gj 与前 num 个主成分系数的乘积得到降维后的数据矩阵 df tf df * z(1:num) / 100; % 计算降维后数据矩阵 df 与前 num 个特征值的乘积并进行缩放得到投资效益值的估计 [stf, ind] sort(tf, descend); % 对投资效益值进行降序排序并返回排序后的结果 stf 和对应的索引 ind stf stf, ind ind4.结果 各年度的综合评价值以及排序结果如下表 年代199319921991199419871990198420001995名次123456789综合评价值2.4464l.97681.11230.86040.84560.22580.05310.0531-0.2534 年代19881985199619861989199719991998名次1011121314151617综合评价值0.26620.52920.74050.77890.97151.1476-1.2015-1.6848 如果这篇文章对你有帮助欢迎点赞与收藏
- 上一篇: 哪些网站可以做免费外贸网站要素
- 下一篇: 哪些网站可以做图片链接站长必备网站
相关文章
-
哪些网站可以做免费外贸网站要素
哪些网站可以做免费外贸网站要素
- 技术栈
- 2026年03月21日
-
哪些网站可以做免费推广机关网页设计价格表
哪些网站可以做免费推广机关网页设计价格表
- 技术栈
- 2026年03月21日
-
哪些网站可以做帮助文档全国网站建设汇编
哪些网站可以做帮助文档全国网站建设汇编
- 技术栈
- 2026年03月21日
-
哪些网站可以做图片链接站长必备网站
哪些网站可以做图片链接站长必备网站
- 技术栈
- 2026年03月21日
-
哪些网站可以做微信大一做家教的网站
哪些网站可以做微信大一做家教的网站
- 技术栈
- 2026年03月21日
-
哪些网站可以做微信推送湛江在线制作网站
哪些网站可以做微信推送湛江在线制作网站
- 技术栈
- 2026年03月21日
