第十三章学习方法

来自cslt Wiki

2022年8月3日 (三) 07:53Cslt（讨论 | 贡献）的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

跳转至：导航、搜索

目录

1 教学资料
2 扩展阅读
3 演示链接
4 开发者资源
5 高级读者

教学资料

教学参考
课件
小清爱提问：什么是爬山法？[1]
小清爱提问：什么是模拟退火算法？[2]
小清爱提问：什么是奥卡姆剃刀准则？ [3]
小清爱提问：为什么说数据是人工智能的粮食？[4]

扩展阅读

维基百科：没有免费的午餐定理 [5]
维基百科：梯度下降法[6][7]
百度百科：梯度下降法[8][9]
知乎：梯度下降法[10]
知乎：小批量梯度下降法[11]
知乎：动量梯度下降法[12][]
维基百科：模拟退火算法 [13][14]
百度百科：模拟退火算法[15][16]
知乎：模拟退火详解 [17]
维基百科：牛顿法 [18][19]
维基百科：奥卡姆剃刀[20][21]
百度百科：奥卡姆剃刀[22][23]
维基百科：过拟合[24][25]
维基百科：GPT-3 [26][27]
机器之心：当谈论机器学习中的公平公正时，我们该谈论些什么？[28]
机器之心：数据增强 [29]
知乎：数据增强 [30][31]
什么是模型预训练[32]
迁移学习 [33]

演示链接

优化方法在线演示 [34]
基于神经网络的二分类任务演示 [35]

开发者资源

高级读者

王东，机器学习导论,第一章“绪论”，第十一章“优化方法”[36]
Wolpert, David (1996), "The Lack of A Priori Distinctions between Learning Algorithms", Neural Computation, pp. 1341–1390 [37]
Sebastian Ruder, An overview of gradient descend algorithms,2017 [38]
Kirkpatrick, S.; Gelatt Jr, C. D.; Vecchi, M. P. (1983). "Optimization by Simulated Annealing". Science. 220 (4598): 671–680. [39]
Brown et al., Language Models are Few-Shot Learners [40]

取自“http://index.cslt.org/mediawiki/index.php?title=第十三章_学习方法&oldid=38821”