数据分析论文基于excel,数据分析与决策毕业设计论文

  

  应粉丝要求,再写一篇潜在品类分析教程,尽量详细。   

  

  首先,问题引入,什么是潜在类别分析?   

  

  潜在类别分析(LCA)是一种统计模型,在该模型中,可以根据个人对一组(分类)测量变量的回答模式,将个人分为互斥和穷举类型,或潜在类别。   

  

  潜在类别分析是根据个体对分类变量的反应,将个体分为相互排斥的群体、群体和潜在类别。   

  

  在这里,组、组和潜在类别都是同一个东西。在这里,大家要注意,在潜在类别分析中,反应变量或表观变化必须是分类变量,这要与潜在剖面分析LPA相区别。   

  

  在创建潜在类别时,您应该首先设置您希望您的数据有多少个潜在类别。我们的标准是,在适合度良好的情况下,尽可能选择潜在可能性最小的类别。   

  

  这里值得注意的是,R语言的poLCA的作者曾这样说过:   

  

  他说,他不会依靠统计标准来决定哪个模型是最好的,但他会看看哪个模型有最有意义的解释,对研究问题有更好的答案。   

  

  也就是说,当你最终考虑你的数据有多少潜在类别时,你必须考虑结果的可解释性。   

  

  今天,我想给你写一个系统的例子。   

  

  

实例操练

  

  

  我们要用的R包是poLCA。做潜在类别分析的时候,我们的数据里不能有0,负值,小数点。还有,如果你的变量是二进制变量,一定不能编码成0或者1,需要改成1或者2。   

  

  运行潜在类别分析的语法。   

  

  PoLCA (formula,data,nclass=2,maxiter=1000,graphs=false,tol=1e-10,na.rm=TRUE,probes.start=null,nrep=1,verbose=true,calc.se=true)是PoLCA包的默认语法参数。   

  

  例如,如果我们仍然使用上一篇文章中的samhsa2015.csv数据集,那么语法可以写成:   

  

  F1-C BIND (MH Intake,MH Diageval,MH Referential,Treat TMT,AdminServ) ~ 1LCA2-POLCA (F1,data=SAMHSA2015,nclass=2,graphs=true)运行后,我们可以绘制图形:   

  

  R数据分析:再写潜在类别分析LCA的做法与解释   

  

  有每个显式变量,两个潜在类别对不同显式变量的反应概率和两个潜在类别中的个体比例。   

  

  循环语法   

  

  我们自己做分析的时候会遇到这样的情况,我不知道我是不是应该把潜在类别的数量固定为几个,所以需要一个一个的去尝试。相信很多使用Mplus的同学都有这样的经历,需要把类别的数量设置成不同的数字,然后重新运行一遍,然后记下结果,再进行比较,选择最佳的模型。   

  

  但是如果用R运行,我们可以写一个循环,让它一次性为我们运行所有的可能性,输出最优的模型。那岂不是很美?所以每个人都有必要掌握一门编程语言。   

  

  循环语法如下:   

ode>#循环所有可能数量的潜类别max_II <- -100000min_bic <- 100000for(i in 2:10){ lc <- poLCA(f, mydata, nclass=i, maxiter=3000, tol=1e-5, na.rm=FALSE, nrep=10, verbose=TRUE, calc.se=TRUE) if(lc$bic < min_bic){ min_bic <- lc$bic LCA_best_model<-lc }} LCA_best_model

大家只需要把自己的数据套进去就可以直接输出最优模型啦。

比如还是我们刚刚用的数据,直接运行循环语法:

max_II <- -100000min_bic <- 100000for(i in 2:10){  lc <- poLCA(f1, samhsa2015, nclass=i, maxiter=3000,               tol=1e-5, na.rm=FALSE,                nrep=10, verbose=TRUE, calc.se=TRUE)  if(lc$bic < min_bic){    min_bic <- lc$bic    LCA_best_model<-lc  }}    LCA_best_model

上面的代码从2到10给你自动拟合10个模型,并输出最优bic的模型,运行时间有点长哈,我电脑跑了20分钟,大家耐心一点。

不过你不用设置跑2到10,一般情况跑2-5个潜类别就完全够用了。

我对我的数据跑完上面的代码后,得到如下结果

R数据分析:再写潜在类别分析LCA的做法与解释

就是说,其实我的数据适合做4个潜类别。

LCA画2D可视化语法

我们poLCA的自己出的图是3D的,我们也可以选择用ggplot2画2D的图出来,代码如下:

lcmodel <- reshape2::melt(LCA_best_model$probs, level=2)zp1 <- ggplot(lcmodel,aes(x = L2, y = value, fill = Var2))zp1 <- zp1 + geom_bar(stat = "identity", position = "stack")zp1 <- zp1 + facet_grid(Var1 ~ .) zp1 <- zp1 + scale_fill_brewer(type="seq", palette="Greys") +theme_bw()zp1 <- zp1 + labs(x = "Fragebogenitems",y="Anteil der Item-\nAntwortkategorien", fill ="Antwortkategorien")zp1 <- zp1 + theme( axis.text.y=element_blank(),                    axis.ticks.y=element_blank(),                                        panel.grid.major.y=element_blank())zp1 <- zp1 + guides(fill = guide_legend(reverse=TRUE))print(zp1)

运行后得到下图:

R数据分析:再写潜在类别分析LCA的做法与解释

这个如怎么解释呢?

我这个数据不是有5个变量嘛,意思就是指标告诉我们根据这5个变量把数据分为4个潜类别比较合适,上面这个图就是每一个潜类别在5个指标上的响应概率,因为我的每个指标都是2分类,pr(1)表示在相应指标响应1的概率,pr(2)表示在相应指标相应2的概率。

理解到这,我们就可以知道潜类别3在每个指标上响应2的概率都很大,而潜类别1在每个指标上响应1的概率都很大,以此类推,根据这些信息你就可以给你数据的每个潜类别进行命名啦。

你学会了嘛?

快快关注一波。

小结

今天又给大家写了潜类别的做法,感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,请关注后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先收藏,再点赞转发。

也欢迎大家的意见和建议,大家想了解什么统计方法都可以在文章下留言,说不定我看见了就会给你写教程哦。

如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何问题,都可以联系我。因为我可以给您提供好的,详细和耐心的数据分析服务。

如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节,量表信效度等等统计技巧有任何问题,请私信我,获取详细和耐心的指导。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人!

猜你喜欢

R数据分析:潜在剖面分析LPA的做法与解释

Mplus数据分析:潜在类别分析(LCA)流程(详细版)

R数据分析:用R语言做潜类别分析LCA

相关文章