我做一个关于教育投资回报的论文,已有二手数据,别的机构搜集的 ,是个让湖北部分高校毕业生填的调查问卷,样本为700多。 Y1: 大学毕业第1年收入, Y2: 第3年收入 Y3: 第5年收入,以上三个都是数值型,基本都是1000以上的 我的X变量涉及三部分内容,一部分是学生的家庭背景(有4个X变量反映,家庭收入,父母职业等),另一部分是大学的作用(也有4个X变量表现,比如所在大学有否职业规划服务,大学级别,大学的专业),还有一部分是求职渠道(也有4个变量); 难道用12个变量一起作用于那三个Y吗? 需要怎么处理X变量自己的内部关系呢?比如很明显“大学的表现“会和“家庭背景”相关,还有好多X变量自己内部的相关。 版上很多做SEM的,调查问卷选项都很统一,比如都是1-5程度型,而我这份问卷这些变量的问题选项有三种类型, 一是0-1 (是或否) 二是1-4程度型(好,还行,一般,不好) 三是直接填大数字的,比如收入(1000以上),比如高考分数(200以上) 我的问题有如下: 1,最初想用LogisticRegression, 因为我有些X变量是“是”或“否 (0和1)的,做多元回归的话,怕不显著,X变量实在太多了,12个。Logistic这个模型合适我论文吗? 2,后来被导师建议用StructuralEquation Model (SEM), 画出比较复杂的相关结构图,用AMOS做。SEM这个模型合适我这篇论文吗? 3,STATA能做SEM模型吗? 4. SEM模型画好结构图,并知道每条连线的相关关系后,需不需要把显著的一些关系变量给拣出来,重新做一下回归分析呢?然后给出p值之类的。
|