CDA LEVEL 1 考试,知识点汇总《因子分析》一、基本概念二、模型设置三、算法解析四、因子得分五、例题精讲
原标题:CDALEVEL1考试 , 知识点汇总《因子分析》
一、基本概念1.什么是因子分析?
主成分分析时一般情况下不能对主成分所代表含义进行业务上的解读 , 因为主成分方向上一般不会恰好某些变量权重大 , 而另外一些变量权重都小 , 这也表现在主成分权重的形成的散点图会偏离坐标轴 。 如果可以将主成分的坐标轴进行旋转 , 使一些变量的权重的绝对值在一个主成分上达到最大 , 而在其他主成分上绝对值最小 , 这样就达到了变量分类的目的 。 对应地 , 这种维度分析方法被称为因子分析 。 因子分析是一类常用的连续变量降维并进行维度分析的方法 , 其经常采用主成分法作为其因子载荷矩阵的估计方法 , 在特征向量方向上 , 使用特征值的平方根进行加权 , 最后通过因子旋转 , 使得变量的权重在不同因子上更加两极分化 。 常用最大方差法进行因子旋转 , 这种方法是一种正交旋转 。
二、模型设置1.正交因子模型
文章图片
文章图片
2.因子载荷矩阵
因子载荷矩阵的估计是因子分析的主要问题之一 。 模型中L称为因子载荷矩阵 , 因子分析是从对L的估计入手的 , 可以从两方面来理解L的含义:
(1)将其看做是对因子进行线性组合时的系数 。 假设相亲对象评分的因子载荷矩阵如下:
文章图片
可以得到 , 父母评价X1=0.4*魅力F1+0.5*财务F2+0.2*责任心F3 , 同事评价与此类似 , 是通过对三个因子进行线性组合获得的 , 组合的系数就是因子载荷矩阵L 。
(2)因子载荷矩阵L还可以看作是是p维空间的一组单位正交向量 , 把这组向量当做坐标轴 , 隐含的因子F投影到这些向量上的值即LF , LF与X-μ之间仅相差一个干扰项 。 因此如果X是标准化过的(μ=0) , 再排除干扰项 , 可以认为在L这个参考系中表示的F与在标准坐标系(单位阵)中的表示的X是等价的 。
三、算法解析1.因子分析的计算过程大致可分为三步
(1)估计因子载荷矩阵
(2)进行因子旋转
(3)估计公共因子(因子得分)
2.因子载荷矩阵的估计
在正交因子模型中 , 假定公共因子彼此不相关且具有单位方差 , 这种情况下 , 因子载荷矩阵及特殊因子的方差需要满足下式 。
文章图片
【CDA LEVEL 1 考试,知识点汇总《因子分析》一、基本概念二、模型设置三、算法解析四、因子得分五、例题精讲】
文章图片
有了因子载荷矩阵 , 可以根据其元素值的大小来判断变量在公共因子中的负荷量大小 , 并以此对公共因子代表的可能含义进行解释 。 假如对本章引例的评价数据进行因子分析 , 得到因子载荷矩阵如下 , 那怎么使用载荷矩阵的值来对公共因子的业务含义做出解释呢?
文章图片
注:因子载荷矩阵L , 代表了变量X在公共因子F上的“载荷” 。
因子分析的目的不仅是要找出公共因子 , 更重要的是要能解释每个公共因子的业务意义 。 通过上面的分析我们可以看到 , 如果载荷矩阵的每列中 , 各元素的绝对值越向0或1“两极分化” , 那么因子负载的代表变量就会比较突出 , 便于我们进行解释 。 相反 , 如果各元素间差别不大的话 , 则不易进行解释 , 例如上例第2列中有不少载荷在0.5附近的中等载荷 , 进行解释时容易导致公共因子的意义含糊不清 。 因此 , 为了使载荷矩阵每列元素更加向两极转化 , 需要对因子载荷矩阵施行旋转变换 。
文章图片
根据正交矩阵的性质 , 正交旋转后的因子轴能保持原有的夹角不变 , 如下所示:
文章图片
文章图片
对主成分法估计的初始因子载荷进行最大方差旋转 , 结果如下:
文章图片
根据载荷矩阵 , 以父母评价X1为例 , 可以得到其由因子进行综合的模型为:父母评价X1=0.897*F1–0.0395*F2–0.163*F3
- 汉语水平考试|在美国贴吧上,一堆外国人中文学到生无可恋…你当年的仇都报了!
- 北京地区2021年度人事考试工作计划公布
- 河南|河南女孩高考114分,以8000字作文抨击考试制度,亲手毁了人生
- 甭管是“单晶冰糖”还是“多晶体冰糖”,全都通过质检考试
- CDA LEVEL 1 考试,知识点汇总《一元线性回归》一、相关关系二、相关系数三、最小二乘法四、评价与检验五、例题精讲
- 朱正廷发布生日单曲概念海报 欢迎珍珠糖参加海报视觉考试
- 室内设计师考试:梁志天推荐的官方专业技能提升路径
- “吃鸡”游戏中出现1张“考试卷”,老玩家第1道题就答错?绝了
- 2021年青海公务员考试招录809名公告
- 中国美术学院|考试期间酒店涨价,学生的钱真好赚!