不知道这样一个程序要跑多久:
files = list.files("training_set", full.names = T)
writeLines("movieID,customerID,Rating,ratingDate,movieReleaseDate",
"training_set.csv")
for (i in 1:17770) {
x = read.csv(files[i], F, skip = 1, as.is = F, stringsAsFactors = F)
x = cbind(i, x, read.csv("movie_titles.txt", F, nrows = 1,
skip = i - 1, as.is = F, stringsAsFactors = F)[1, 2])
write.table(x, file = "training_set.csv", append = T, sep = ",",
row.names = F, col.names = F, quote = F)
}
当我没加入第7~8行的read.csv()那一句时,程序在WinXP+奔四3.0GHz+512M内存下跑了47分钟把一个2G多的CSV数据文件写完了。不过等我用SQL语句去读其中一列时,发现内存终于不够用了。
Netflix的奖金是$1,000,000,呃,这么大一堆钱,做做梦吧。莫非这个奖还要比拼各家的计算机配置?国内啥时候能有这样的悬赏啊?
赞赏
作为一名没有固定工作的自由职业者,我非常感谢您通过捐赠的方式来支持我的写作和开源软件开发。当然,捐赠纯属自愿。无论金额多少,都是一片诚挚的心意。支付方式如下:
| 微信 | ← 奋力支开它俩 → | 支付宝 |
|---|---|---|
![]() |
其它爱心通道 ↓ Venmo: @yihui_xie Zelle: xie@yihui.name PayPal: xie@yihui.name |
![]() |
若使用 Venmo/Zelle/Paypal,请添加备注“gift”或“donation”,以免捐赠被视为我的可税收入。若使用 Paypal,支付类型请选 Family and Friends,而不要选 Goods and Services。
在不影响生活的前提下,我会将收到的捐赠以尽量大的比例回馈给开源社区和慈善机构。作为参考,2024-25 年间我共收到约三万美元捐赠,完税后我转手捐出了一万五千美元。

