其实在半年多以前我对数据挖掘和机器学习还持有一定的反对态度,但后来这种态度逐渐转变了,甚至现在变成对经典统计学的内容开始持有一些怀疑态度(典型的例子如结构方程模型,我觉得它基本上就是统计宗教)。
我自己态度转变的根本原因其实直到近日看一段关于交叉验证(Cross-Validation)的文字的时候才思考明白,原来冥冥中是Type III Error在指引我。在我听的课以及读的书中,还从未遇到过这样一种正式的表述:与Type I Error和Type II Error能到同一等级。具体细节参考Wikipedia,总之大意就是,用“正确”的方法解决本身错误的问题。
从关心模型到关心数据,进而关心怎样充分利用数据本身的信息,这必然是统计哲学和统计方法论的重大进步。参考Breiman(2001)在Statistical Science上的文章。
外一篇:好心的易老太
中午吃完饭噌噌噌往回走,路上遇见易老太和刘老太晃晃悠悠在路上也往办公室走,我和二位老太打了招呼,然后顺便向刘老太复了命,然后就回来了。过了一会儿,易老太噔噔噔跑到我这边办公室来,说“你是不是没有毛衣啊,没见你没穿,我那儿有几件”,我赶紧叩谢老太,说我有毛衣,只是没穿而已,不冷,云云。老太就回去了。想当年,刚来人大的时候,林老太也是这样。我对人大这所学校并没有太深的感情,但对咱学院还是有着十分深厚的感情的。易老太真是好心人……
赞赏
作为一名没有固定工作的自由职业者,我非常感谢您通过捐赠的方式来支持我的写作和开源软件开发。当然,捐赠纯属自愿。无论金额多少,都是一片诚挚的心意。支付方式如下:
| 微信 | ← 奋力支开它俩 → | 支付宝 |
|---|---|---|
![]() |
其它爱心通道 ↓ Venmo: @yihui_xie Zelle: xie@yihui.name PayPal: xie@yihui.name |
![]() |
若使用 Venmo/Zelle/Paypal,请添加备注“gift”或“donation”,以免捐赠被视为我的可税收入。若使用 Paypal,支付类型请选 Family and Friends,而不要选 Goods and Services。
在不影响生活的前提下,我会将收到的捐赠以尽量大的比例回馈给开源社区和慈善机构。作为参考,2024-25 年间我共收到约三万美元捐赠,完税后我转手捐出了一万五千美元。

