百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

16种常用的数据分析方法-典型相关分析

gaoyangw 2025-04-29 00:25 3 浏览 0 评论

CCA典型相关分析(canonical correlation analysis)从总体上把握两组指标之间的相关关系,分别提取两组变量有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

简单相关系数用来描述两组变量相关关系时只是考虑单个X、Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,相关性问题更加复杂,整体描述困难。

典型相关分析弥补了简单相关性分析的缺陷,是专门针对两组变量间相关性分析的一种统计方法。也是一种降维技术。

典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。


典型相关分析基本思想

1936年,Hotelling提出典型相关分析。Hotelling提出分析两组变量的线性组合, 研究它们之间的相关系数p(u,v)。

在所有线性组合中,找出一对相关系数最大的线性组合, 用这个组合的单相关系数来表示两组变量的相关性, 成为两组变量的典型相关系数,而这两个线性组合叫做一对典型变量。两组多变量的组合需要用若干对典型变量完全反映它们之间的相关性。

在两组变量的线性组合中,找出与u1,v1不相关的线性组合,找出一对相关系数最大的线性组合, 即:第二对典型变量,把p(u2,v2)做为第二个典型相关系数。用此方法继续得到若干对典型变量,最终提取出两组变量间的全部信息。

其中“相关系数”、“典型变量”的基本概念为:

l典型变量(Canonical Variates)

首先,两个变量集合X和Y:

接着,定义两个线性关系的集合U和V,其中U是X的线性组合,V是Y的线性组合:

其中,U为p行p列(X为p列,对每一维都线性组合),V为p行q列(Y为q列,对每一维都线性组合),至于都是p行,是为了形成典型变量对。

典型变量对(canonical variate pair)

典型变量对共有p对(p ≤ q)

如:(U2, V2) = (a21X1 + a22X2 + ··· + a2pXp, b21Y1 + b22Y2 + ··· + b2qYq)

l相关系数

若ρXY=0,则称X与Y不线性相关。


实战案例

CRM(CustomerRelationshipManagement)即客户关系管理系统有三组变量:

公司规模变量2个:资本额,销售额

CRM实施程度变量6个:WEB网站,电子邮件,客服中心,DM快讯广告,无线上网,简讯服务

CRM绩效维度3个:行销绩效,销售绩效,服务绩效

分析目标:试对三组变量做典型相关分析。

原始业务数据格式如图,以下对三组变量两两做典型相关分析。

一、公司规模、CRM实施程度做典型相关分析

SPSS未提供典型相关分析的交互窗口,要直接在synatxeditor窗口中呼叫SPSS的CANCORR程序执行分析。注意:cancorr不能读取中文名称,需将变量改为英文名称。

打开文件后,选择“File-new—synatxeditor”打开语法窗口,输入语句:

INCLUDE'D:spss19SamplesEnglishCanonicalcorrelation.sps'.

CANCORRSet1=CapitalSales

/Set2=WebMailCallDMMobileShortM.

小写字母也行,但是变量名字必须严格一致

include'D:spss19SamplesEnglishCanonicalcorrelation.sps'.

cancorrset1=CapitalSales

/set2=WebMailCallDMMobileShortM.

注意第三行的“/”不能为“”

ORun—>all得到典型相关分析结果

典型相关分析结果

第一组变量间的简单相关系数


第一组变量间简单相关系数

第一对典型变量的典型相关系数为CR1=0.434,第二对典型变量的典型相关系数为CR2=0.298.



相关系数显着性检验

此为检验相关系数是否显着的检验,原假设:相关系数为0。每行的检验都是对此行及以后各行所对应的典型相关系数的多元检验。

第一行获得第一对典型变量的典型相关系数不为0,相关性显着。

第二行sig值P=0.263>0.05,在5%显着性水平下不显着。

第一个典型变量标准化典型系数

第一个典型变量的标准化典型系数为-0.287和-0.774.

CV1-1=--0.287capital--0.774sales

CV1-2=--1.4capital+1.2sales


第二个典型变量标准化典型系数

CV2-1=--0.341web+0.117mail+0.027call—0.091DM—0.767mobile—0.174shortm

CV2-2=--0.433web—0.168mail—1.075call+0.490DM+0.139mobile+0.812shortm

典型负荷系数和交叉负荷系数表



重叠系数分析Redundancyindex

0.157=*0.833=0.434^2*0.833

0.08==0.434^2*0.425

计算获得的典型变量

此为计算的典型变量,保存到原文件后部。

二、公司规模与CRM绩效的典型相关分析

典型相关分析结果

CRM绩效与CRM实施程度典型相关分析表:

分析结果解读:

公司规模与CRM实施程度显着相关,且公司规模越大实施程度越高;

CRM实施程度越高越能实现CRM绩效,但公司规模与CRM绩效并不显着相关;

就整体而言:

公司规模不直接影响CRM绩效,是通过CRM实施程度间接影响CRM绩效。

影响CRM绩因素很多,光靠较大公司规模还不是CRM绩效的保证,还有其他因素影响CRM绩效。



相关推荐

企业宣传册该怎么做?超级干货,制作教程戳这里

公司宣传册做得好,可以进一步展示企业文化,为企业树立一个良好的形象,促进企业的发展。那么应该怎样才能把企业宣传册做得好?...

GIF动图怎么制作?教你3个好用的制作方法

GIF的全称为GraphicsInterchangeFormat,可译为图像互换格式,我们一般也称它为动图,它是一种位图图形文件格式,以8位色(即256种颜色)重现真彩色的图像。...

提前三天教你们python制作万能抢购神器,学不会就准备过光棍节吧

目录前言:分析(x0)...

别不信,我用一张图就能搞定一整份PPT,还能被领导夸一句

很多人在制作PPT的时候,都一定会从素材网站里找很多图片,来做背景或者插图。那么你有没有想过,如果时间不够用,而且你只有一张图,该怎么办?这个问题,看完这篇文章你立马就能解决!而且我还把文中超级炫酷的...

如何制作网站落地页?

落地页是什么?就是当你打开一个网页时,你第一眼所见到的界面就是网站的落地页面(登录页面)。落地页也称“着陆页”,是指访问者在其他地方看到发出的某个具有明确主题的特定营销活动,点击后被链接到你网站上的第...

整点不一样的网站制作教程,教你怎么用网站模板制作网站#...

网站制作教程整点不一样的网站。不要再问我网站制作教程了,今天给你整个怎么用网站模板制作网站的教程。·1、登录账号进入后台。·2、选择模板。自助建站平台通常提供各种各样的网站模板,可以根据自己的需求和喜...

图文教程:免费注册.PW顶级域名和免费制作一个企业网站

当你看到这篇文章的时候,肯定第一反应是“天下没有免费的午餐”。哪有那么便宜的事情,免费给你注册一个.PW顶级域名,而且还送一个企业网站。会有什么猫腻呢?笔者告诉你,猫腻就是耐思尼克想要让更多的人接触到...

作为数据分析师,学会这4个chatgpt使用技巧,根本不担心被取代!

上文给简单聊了一下为什么ChatGPT不能取代数据分析师,本文我们来深入感受一下如何让GPT帮助数据分析师“提效...

16种常用的数据分析方法-典型相关分析

CCA典型相关分析(canonicalcorrelationanalysis)从总体上把握两组指标之间的相关关系,分别提取两组变量有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组...

推荐几款可视化数据分析工具

数据是一座待挖掘的金矿。进入数据大爆炸时代,各种数据据呈现爆发式增长,越来越多的人将通过数据来寻求事物背后规律的解答。不管是以往专业性的数据挖掘工具还是如今集成一体的数据可视化工具,都见证着数据分析发...

网站运营需要哪些数据支持,如何对数据进行有效分析?

网站运营需要哪些数据支持这个问题是比较泛的,为什么这么说呢?在我们运营一个网站的时候,我们面对的不同行业和不同业务,所需要的数据也都不一样的。比如我们运营一个旅游网站,我们需要用户的行为数据,网站的...

独家揭秘:人为峰如何玩转网站流量的大数据分析

当网站建设好后,很多客户可能就放在一边,其访问量不知道各个企业是否有关注与做数据分析呢?网站设计及建设后我们的最终目的是希望其网站正式上线后能带来更多的流量,并转换成销量。人为峰网络营销除了可以提...

全套新媒体数据分析表

编辑:正兴资料君(关注我,每天领福利)今日分享:...

机器学习第五发:BS教你如何解析网页,规整数据?

现在越来越多的应用和互联网产品做内容的聚合,像今日头条、等等,太多的聚合应用以及不胜枚举,甚至浏览器也可以嵌入聚合的应用。互联网上拥有太多太多的数据,抓取网页的数据做数据挖掘也是最廉价的获取数据的途径...

今日头条网站数据分析

今日头条是大家最熟悉的新媒体平台,也是拥有大量自媒体作者的平台,很受网友欢迎,那么我们从seo角度去分析这个平台网站数据,看看是不是我们想象的那么完美。下面是查询今日头条网站的结果:提炼一下,总结以下...

取消回复欢迎 发表评论: