若某种统计分析得不出结论,有些人便会着急或恼火,什么破统计?辛辛苦苦做个t检验,结果竟然是不显著;任劳任怨做了K-Means聚类分析,聚类结果竟然不稳定,样本一会儿在这一类,一会儿在那一类……
这种现象很普遍,也很容易理解。不知道是谁制造了这样的“言必称显著”的假象,这里面肯定不止一个“谁”。我们都怕没结论可讲,尤其是没有漂亮的结论。想一想,给外行们来一句,“Statistically speaking, the difference is significant at a 0.05 level”,那是多么拽的一件事情。再不行,我搬出K-Means聚类吓死你,看我用K-Means可以把我的样本聚为漂亮的三类。再不行,小样儿你懂LASSO么?知道CART不?明白啥叫希尔伯特空间不?整个VC dimension给你瞅瞅,中不?
今天一位不明来路的陌生人给我发Email问K-Means聚类的问题,说是聚类结果不稳定(不同的初始值会收敛到不同的聚类结果),问怎样选取好的初始值,以及怎样的聚类结果是正确的。
有奖问答:观众朋友们你们觉得这个问题该怎样回答?
(奖品为新年特别礼物一份,各大超市、商场均有售,领取办法为:1、进入商场/超市;2、拿起任意一份你心仪的礼物;3、撒开四蹄给我使劲跑,谁喊都别回头。)
赞赏
作为一名没有固定工作的自由职业者,我非常感谢您通过捐赠的方式来支持我的写作和开源软件开发。当然,捐赠纯属自愿。无论金额多少,都是一片诚挚的心意。支付方式如下:
| 微信 | ← 奋力支开它俩 → | 支付宝 |
|---|---|---|
![]() |
其它爱心通道 ↓ Venmo: @yihui_xie Zelle: xie@yihui.name PayPal: xie@yihui.name |
![]() |
若使用 Venmo/Zelle/Paypal,请添加备注“gift”或“donation”,以免捐赠被视为我的可税收入。若使用 Paypal,支付类型请选 Family and Friends,而不要选 Goods and Services。
在不影响生活的前提下,我会将收到的捐赠以尽量大的比例回馈给开源社区和慈善机构。作为参考,2024-25 年间我共收到约三万美元捐赠,完税后我转手捐出了一万五千美元。

