第一次基本回归之后,R方还相当小,可解释的部分不多,残差里还有很多函数,现在需要把这些函数从残差里找出来。
在SPSS点了很久之后,手累了,而SPSS的Syntax功能又相当弱,循环里只能跑描述,不能跑回归,于是想到用Stata。
假定在数据文件里已经有了edu这个变量,我需要做的是,找出edu的各个变式(也就是edu的各种初级函数),然后用基本回归方程的残差对这些变式的两两组合、三三组合甚至四四组合做回归,找到显著的项。
以三三组合为例,下边的这个do文件可以实现:
set more off
//compute
gen sqrtEdu = sqrt(edu)
gen edu2 = edu^2
gen edu3 = edu^3
gen edu4 = edu^4
gen daoEdu =1/edu
gen lnEdu = ln(edu)
gen daoLnEdu = 1/ln(edu)
gen sinEdu = sin(edu)
gen tanEdu = tan(edu)
gen arctanEdu = atan(edu)
gen expEdu = exp(edu)local v1 “edu sqrtEdu edu2 edu3 edu4 daoEdu lnEdu daoLnEdu sinEdu tanEdu arctanEdu expEdu”
local v2v1'v1′
local v3
local v4v1'
/*
local ih = 1
local ii = 1
local ij = 1
*/
local add=0foreach h of local v1 {
foreach i of local v2 {
foreach j of local v3 {
//if (h’ !=i' &h’ !=j' &i’ !=j') {h’ <
if (i’ &h' <j' &i' <j') {add' + 1
//local add =
//diadd'h'
capture est clear
reg resdbtimei'j'
outreg2 using reg_restdbtime_edu.txt,append
}
}
}
}
*/
