第一次基本回归之后,R方还相当小,可解释的部分不多,残差里还有很多函数,现在需要把这些函数从残差里找出来。
在SPSS点了很久之后,手累了,而SPSS的Syntax功能又相当弱,循环里只能跑描述,不能跑回归,于是想到用Stata。
假定在数据文件里已经有了edu这个变量,我需要做的是,找出edu的各个变式(也就是edu的各种初级函数),然后用基本回归方程的残差对这些变式的两两组合、三三组合甚至四四组合做回归,找到显著的项。
以三三组合为例,下边的这个do文件可以实现:

set more off

//compute

gen sqrtEdu = sqrt(edu)
gen edu2 = edu^2
gen edu3 = edu^3
gen edu4 = edu^4
gen daoEdu =1/edu
gen lnEdu = ln(edu)
gen daoLnEdu = 1/ln(edu)
gen sinEdu = sin(edu)
gen tanEdu = tan(edu)
gen arctanEdu = atan(edu)
gen expEdu = exp(edu)

local v1 “edu sqrtEdu edu2 edu3 edu4 daoEdu lnEdu daoLnEdu sinEdu tanEdu arctanEdu expEdu”
local v2 v1'
local v3
v1′
local v4 v1'
/*
local ih = 1
local ii = 1
local ij = 1
*/
local add=0

foreach h of local v1 {
foreach i of local v2 {
foreach j of local v3 {
//if (
h’ != i' & h’ != j' & i’ != j') {
if (
h’ < i’ & h' < j' & i' < j') {
//local add =
add' + 1
//di add'
capture est clear
reg resdbtime
h' i' j'
outreg2 using reg_restdbtime_edu.txt,append
}
}
}
}
*/