这本书已经有了十几年的历史,现在将要出第五版。前面四版已经作为参考书或教科书在许多学校使用。各个学校的师生对该书提出许多宝贵的意见,并且指出了很多错误和不妥之处。读者的支持和鼓励,对该书各版的诞生起着关键的作用。第五版在许多地方对前面几版进行了修改和增减。免费的自由编程的开源软件R及Python在国际上已经成为数据科学教学和科研的主要软件,该书第五版全部采用R及Python软件来描述计算过程,R及Python软件非常强大,凡是国际上出现的新方法,都会很快地上传到R的网站上或出现在Python的应用中,不能想象一个涉及数据科学的教师或者研究生不会熟练使用R或者Python。从R和Python的功能和使用者的人数来说,它已经远远超过所有的昂贵的商业软件。R及Python软件的绝大部分程序包或模块的代码都是公开的,透明是防止腐败的好方式。此外,由于R及Python在中国的普及越来越广泛,网上关于R及Python的互动和帮助的环境也已经形成,中国学生和实际工作者完全可以赶上国际统计界使用R及Python的主流。