我们在这里讨论所谓的“分段线性回归模型”,因为它们利用包含虚拟变量的交互项。最近我们被客户要求撰写关于分段回归的研究报告,包括一些图形和统计输出。

读取数据

data=read.csv("artificial-cover.csv")

查看部分数据

head(data)

##   tree.cover shurb.grass.cover

## 1       13.2              16.8

## 2       17.2              21.8

## 3       45.4              48.8

## 4       53.6              58.7

## 5       58.5              55.5

## 6       63.3              47.2

 

###########用lm拟合,主要注意部分是bs(age,knots=c(...))这部分把自变量分成不同部分

fit =lm(tree.cover~bs(shurb.grass.cover ,knots

############进行预测,预测数据也要分区

pred= predict (fit , newdata =list(shurb.grass.cover =data$shurb.grass.cover),se=T)

#############然后画图

plot(fit)

可以构造一个相对复杂的 LOWESS 模型(span参数取小一些),然后和一个简单的模型比较,如:

qplot(x, y) + geom_smooth() # 总趋势<

精彩链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。