R语言与应用计量经济学

2020-06-16 00:00:00 数据 语言 的是 这本书 计量

虽然计量经济学和统计学关系密切,但是两者存在较大的差异性。应用计量经济学主要是研究经济变量之间的关系,并且努力证明其为因果关系。这也是为什么现在在经管类实证研究文献中基于自然实验(Natural Experiment)的经验研究非常流行的原因。

除了学科本身的差异以外,两个群体用的工具也存在较大的差异。应用计量经济学的人较多的是用Stata,统计学的人较多的是用R。



  • 事实上的通用工具Stata


Stata的优势在于提供一站式的软件包,并且也可以以ado文件的形式进行扩展,自带的PDF用户手册(TeX)非常详细。作为商业软件Stata为数据分析结果提供verifiably accurate,其分析结果被FDA认可。数据分析结果高度可信,这个优点得到每一个用户的喜欢。

当然了缺点也有,不然在应用计量领域中没有R的事情了。

如扩展丰富度不够(与R比);

一个窗口只能保留一个数据文件;

数据可视化水平一般

……

所以The 2016 Stata Conference开始考虑Stata与Web的交互能力,甚至考虑用Stata做出D3.js那样的数据可视化作品。



  • 日益丰富的R


R语言的优点在网上有很多。这里就不多多说了。如可以操作多个数据集和对象、Rstudio提供良好的开发环境、丰富的画图包,静态的ggpot2,交互式的plotly、号称操作100GB数据的data.table、可以生成动态报告的rmarkdown、量化投资利器quantmod……在大数据的热潮中,微软加盟R语言社区,还专门发行了增强版的R语言MRO,并且在自己的产品中嵌入R。

R语言这么厉害,当然也会被引入到应用计量经济学中。Kleiber and Zeileis(2008)写了一份小册子Applied Econometrics with R,这个算是比较早专门介绍R语言在应用计量经济学中的使用。因为这本书还有一个专门的R包AER。不过这个AER非彼AER(American Economic Review)。

Zeileis and Koenker(2008)在JSS上写了一篇文章,名字非常带感Econometrics in R: Past, Present, and Future。这么多年过去了,当年的Future已经是Present,只是现在这个Present估计还没有达到他们当年的预期。

R语言社区在CRAN Task View设立一个Econometrics,包的种类挺丰富:Basic linear regression、Microeconometrics、Instrumental variables、Panel data models、Further regression models、Time series data and models、Data sets和Miscellaneous。

面对眼花缭乱的包、风格迥异的操作,没有老司机带路,新手不敢上路呀。所以一般的新手纷纷奔向Stata阵营去了。因为围绕着Stata讲应用计量经济学的教程实在是太多了。



  • 经管类小伙伴如何上手R

Muenchen R A, Hilbe J. R for Stata users[M]. New York, New York: Springer, 2010.

一本介绍转向R的书。

R FOR STATA USERS

Dictionary: Stata to R

Getting Started in R~Stata

这个三个材料很棒,简明,迅速!采用对比的手法,帮助Stata用户快速上手R。

Kleiber C, Zeileis A. Applied econometrics with R[M]. Springer Science & Business Media, 2008.

比较全面的把R带入应用计量经济学。

Farnsworth G V. Econometrics in R[M]. 2014.

70页的小册子,快速熟悉各类应用计量模型。

经管类的小伙伴一定对Wooldridge不陌生。如果把Wooldridge的Introductory Econometrics用R实现一遍是什么样的感觉?

哈哈,已经有牛人做了。这就是Heiss写的Using R for Introductory Econometrics。

"A very nice resource for those wanting to use R in their introductory econometrics courses." (Jeffrey M. Wooldridge)

这本书配套2016年版的Introductory Econometrics,而且还介绍了R with R Markdown or LaTeX。想了解Rmarkdown点这里。

这本书提供了网页版,可以在线阅读。当然也可以在网上买实体书。

做资本市场数据的小伙伴手头上常常玩的是面板数据。R如何处理面板数据?

Croissant Y, Millo G. Panel data econometrics in R: The plm package[J]. Journal of Statistical Software, 2008, 27(2): 1-43.

上面这篇PDF是做面板的一个很好的读物。它对plm包做了十分细致的描述,应用的便捷程度不下于Stata的xtreg命令集。

Croissant and Millo(2016)干脆把2008年在JSS上的文章丰富一下,就整成了一本小册子。

Croissant Y, Millo G. Panel Data Econometrics with R[M]. Wiley-Blackwell, 2016.

做时间序列(金融数据)的小伙伴可以阅读下面这本书。

Tsay R S. An introduction to analysis of financial data with R[M].



  • 三个建议


R发行版可以采用微软的版本Microsoft R Open,充分利用多核处理器的优势。

IDE,IDE,IDE。尽量采用IDE,提高效率。可以用Rstudio(preview-release)。

优先使用知名的包、一直在更新的包。这个很重要。一个R包排行榜。



  • 结束


到这里基本上已经介绍了R在应用计量经济学中的主要板块中的教程,可以放心学习上手R了。

不过……

R的包多是多,但是质量良莠不齐,代码风格不统一。

有些R包的说明文档解释不全,导致用户对各个参数的使用并不明晰。

The R Core Team特别提醒用户,“R is free software and comes with ABSOLUTELY NO WARRANTY ”。

前方有坑,小心驾驶……

======================================================================

更新1:

Principles of Econometrics with R,点击链接可以下载。这本书不错,2016出来的,比较全面展现了R在应用计量中的使用。数据链接。

更新2:

Applied Econometrics,采用R语言和Stata双语教学


更新3:

Introduction to Econometrics with R,增加本条目时,该教程2018-09-17修改。新。


有新材料出现,再补上

相关文章