“Machine Learning Book”版本间的差异

2017年4月11日 (二) 23:59的版本

Introduction

2012年，我回到清华大学语音语言技术中心（CSLT）任教，继续关于语音识别相关领域的研究，同时亦开始自然语言处理、金融信号处理等方面的工作。这三方面的工作虽相差甚远，但都离不开机器学习的基础知识。另一方面，由于清华自身的学生名额极少，实验室要想发展，不得不接收一些短期的实习学生。这样就造成这样一种局面，不论是从事哪方面研究的实习生，我们都不得不对他进行基础机器学习知识的培训。这种培训非常频繁。

当前关于机器学习方面的资料非常丰富：Andrew NG在Coursea上的机器学习教程、Bishop的《机器学习与模式识别》和周志华老师的《机器学习》都是非常好的基础教材；Goodfellow等人的《深度学习》是学习深度学习技术的首选资料；MIT、斯坦福等名校的公开课也非常有价值；一些主要会议的Tutorial、keynote也都可以在网上搜索到。然而，在对学生们进行培训的过程中，我深感这些资料专业性很强，但入门不易。一方面可能是由于语言障碍，另一个主要原因在于机器学习覆盖面广，研究方向庞杂，各种新方法层出不穷，初学者往往在各种复杂的名词，无穷无尽的算法面前产生畏难情绪，导致半途而废。

2016年7月到8月，我在CSLT组织了一次关于机器学习的内部暑期研讨班，主要目的不是细致讨论各种具体算法，而是将各种看似高深的方法有机组织起来，告诉学生们每种方法的基本思路、基本用法及与其它技术的关联，帮助其走入机器学习的宏伟殿堂。除了我讲以外，还有冯洋老师、王彩霞老师、王卯宁老师三位，分别讲述图模型、核方法和遗传算法三部分。研讨班取得了意想不到的效果，很多学生不仅掌握了基础知识和研究技巧，同时也对机器学习产生了浓厚兴趣，为进一步深入研究打下了基础。这期研讨班的幻灯片、视频及辅助资料已经在网上公开。

本书的主体内容即是基于该研讨班形成的总结性资料。基于作者的研究背景，这本书很难说是机器学习领域的专业著作，而是一本学习笔记，是从一个机器学习技术使用者角度出发对机器学习知识的一次总结，并加入我们在本领域研究中的一些经验和发现。与其说是一本教材，本书更象是一本科普读物，用轻松活泼的语言和深入浅出的描述为初学者打开机器学习这扇充满魔力的大门。打开大门以后，我们会发现这是个多么让人激动人心的领域，每天都有新的知识、新的思路、新的方法产生，每天都有让人振奋的成果。我们希望这本书可以让更多学生、工程师和相关领域的研究者对机器学习产生兴趣，在这片异彩纷呈的海域上找到属于自己的那颗宝石。

本书还在编写过程中，目前已经完成四章。计划在四个月以内完成剩余章节。相关资料会随着写作进度更新。

当前版本完全是草稿，其中一些引用、图片版权等信息还未处理。该资料不作为任何公开发表内容使用。

Version 2017-04-12

pdf

“Machine Learning Book”版本间的差异

2017年4月11日 (二) 23:59的版本

Introduction

Version 2017-04-12

导航菜单

个人工具

名字空间

变种

查看

操作

搜索

导航

工具

@@ 第1行： / 第1行： @@
-Version 2017-04-12 [http://wangd.cslt.org/public/book/ml/ml-v-2017-04-12.pdf pdf]
+==Introduction==
+年，我回到清华大学语音语言技术中心（CSLT）任教，继续关于语音识别相关领域的
+研究，同时亦开始自然语言处理、金融信号处理等方面的工作。这三方面的工作虽
+相差甚远，但都离不开机器学习的基础知识。另一方面，由于清华自身的学生名额极少，实验室
+要想发展，不得不接收一些短期的实习学生。这样就造成这样一种局面，不论是从事哪方面研究的
+实习生，我们都不得不对他进行基础机器学习知识的培训。这种培训非常频繁。
+当前关于机器学习方面的资料非常丰富：Andrew NG在Coursea上的机器学习教程、Bishop的《机器学习与模式识别》
+和周志华老师的《机器学习》都是非常好的基础教材；Goodfellow等人的《深度学习》是
+学习深度学习技术的首选资料；MIT、斯坦福等名校的公开课也非常有价值；
+一些主要会议的Tutorial、keynote也都可以在网上搜索到。然而，在对学生们进行培训的过程中，
+我深感这些资料专业性很强，但入门不易。一方面可能是由于语言障碍，另一个主要原因在于机器学习覆盖
+面广，研究方向庞杂，各种新方法层出不穷，初学者往往在各种复杂的名词，无穷无尽的
+算法面前产生畏难情绪，导致半途而废。
+年7月到8月，我在CSLT组织了一次关于机器学习的内部暑期研讨班，主要目的不是细致
+讨论各种具体算法，而是将各种看似高深的方法有机组织起来，告诉学生们每种方法
+的基本思路、基本用法及与其它技术的关联，帮助
+其走入机器学习的宏伟殿堂。除了我讲以外，还有冯洋老师、王彩霞老师、王卯宁老师
+三位，分别讲述图模型、核方法和遗传算法三部分。研讨班取得了意想不到的效果，很多学生
+不仅掌握了基础知识和研究技巧，
+同时也对机器学习产生了浓厚兴趣，为进一步深入研究打下了基础。这期研讨班的幻灯片、视频及
+辅助资料已经在网上公开。
+本书的主体内容即是基于该研讨班形成的总结性资料。基于作者的研究背景，这本书很难说
+是机器学习领域的专业著作，而是一本学习笔记，是从一个机器学习
+技术使用者角度出发对机器学习知识的一次总结，并加入我们在本领域研究中的一些经验和发现。
+与其说是一本教材，本书更象是一本科普读物，
+用轻松活泼的语言和深入浅出的描述为初学者打开机器学习这扇充满魔力的大门。
+打开大门以后，我们会发现这是个多么让人激动人心的
+领域，每天都有新的知识、新的思路、新的方法产生，每天都有让人振奋的成果。我们希望这本书
+可以让更多学生、工程师和相关领域的研究者对机器学习产生兴趣，在这片异彩纷呈的海域上找到
+属于自己的那颗宝石。
+本书还在编写过程中，目前已经完成四章。计划在四个月以内完成剩余章节。相关资料会随着写作进度
+更新。
+当前版本完全是草稿，其中一些引用、图片版权等信息还未处理。该资料不作为任何公开发表内容使用。
+==Version 2017-04-12==
+[http://wangd.cslt.org/public/book/ml/ml-v-2017-04-12.pdf pdf]