免费赠书 | 首波圣诞福利:清华大牛手把手教你机器学习与实践

社区活动 Admin ⋅ 于 9个月前 ⋅ 最后回复由 SIGAI_LeiMing 8个月前 ⋅ 1666 阅读

过了这个周末,圣诞节就来啦,为庆祝这个特别的节日,极市决定当一回圣诞老人,给 各 位 提 前 送 一 波 礼 物 啦!

file
机器学习和深度学习领域又一力作 ——《机器学习与应用》免费送!本书是毕业于清华大学计算机系的雷明大佬新书,系统、深入地讲述了机器学习与深度学习的主要方法与理论,并紧密结合工程实际与应用,值得入手。

file


❆作者简介

雷明,毕业于清华大学计算机系,研究方向为机器学习、计算机视觉。有超过12年的学术研究与产品研发经验,曾发表论文数篇,具有深厚的理论功底与丰富的实践经验。其撰写的系列技术文章在半年内累计阅读量达数百万次,擅长用生动、形象的语言把复杂、抽象的理论和算法解释清楚。


❆超级福利

即刻起只要在本帖下提出关于本书的疑问或留言回复机器学习深度学习中遇到的问题,极市将邀请本书作者雷明大大在留言中回复答疑。

大牛作者亲自与你交流技术问题

简直比圣诞老人还圣诞老人啊

机会难得不可错过哦~


如何参与:

1、留言提出关于本书的疑问或机器学习中遇到的问题,极市将邀请雷明大大在社区中回复答疑,12月24日18:00,极市和雷老师会共同在所有留言中随机抽选5位免费赠送《机器学习与应用》纸质书籍一本。

2、所有留言回复者均可获得一份极市整理的技术干货资源(含CVPR/VALSE/PRCV论文及视频资源、电子书籍/学习资料等)


适读人群:

  • 计算机,电子,自动化,人工智能等相关专业的本科生,研究生
  • 从事人工智能学术研究与产品研发的人员
  • 对人工智能、机器学习感兴趣的人


❆本书优势(附精彩试读)

1、内容全面、系统,紧跟时代步伐

完整的讲述了机器学习、深度学习主要算法以及在各个领域的典型应用,含括了学术界与工业界截止2017年初的新成果,紧跟时代步伐,弥补了市面上经典教材内容老化的缺憾。


精彩试读
图像超分辨的目标是由低分辨率的图像得到高分辨率的图像,传统的做法大多采用纯图像处理的技术。用机器学习的思路解决超分辨问题取得了更好的效果,卷积神经网络被成功地用于超分辨问题。文献[7]提出了一种用生成对抗网络框架解决图像超分辨问题的方法,称为超分辨生成对抗网络,简称SRGAN,能够将缩小4倍以上的图像进行复原。

这种方法使用了一种新的损失函数,由对抗损失和内容损失两部分构成。第一部分损失和标准生成对抗框架相同,通过一个判别模型,让生成网络生成的超分辨图像和真实高分辨率图像尽可能接近。

生成器卷积网络采用了深度残差网络;判别模型也是一个层次很深的卷积网络,用于区分一张图像是真实的高分辨率图像还是由生成器网络生成的图像。网络结构如下图所示。

file

图像超分辨的网络结构

假设低分辨率图像为file,这里的目标是根据它估计出高分辨率的图像file,在训练样本中与低分辨率图像相对应的真实高分辨率图像为file


2、推导论证清晰、深入、详细

绝大部分核心算法均有详细的推导、证明过程,从问题本源、思想层面对算法进行讲解,让读者不仅知其然还知其所以然,真正掌握算法的思想与精髓。在书的前部对机器学习所需的数学知识也做了系统的讲解。


精彩试读
目标函数的二阶导数为η,前面假设二阶导数η>0,从而保证目标函数是凸函数,即开口向上的抛物线,有极小值。如果η<0,或者η=0该怎么处理?对于线性核或正定核函数,由于矩阵K的任意一个上述子问题对应的二阶子矩阵半正定,必定有η>=0。下面给出证明这个关于两个变量的子问题的目标函数是凸函数,只需要证明它的Hessian矩阵是半正定矩阵。这两个变量的目标函数的Hessian为

file

和10.3.2节证明整个对偶问题的Hessian矩阵正定的方法相同,如果是线性核,这个矩阵也可以写成一个矩阵和它的转置的乘积形式:

file

矩阵A为训练样本特征向量乘上类别标签形成的矩阵。显然这个Hessian矩阵是半正定的,因此必定有η>=0。如果是非线性核,因为核函数相当于对两个核映射之后的向量做内积,因此上面的结论同样成立。

无论本次迭代时αi和αj的初始值是多少,通过上面的子问题求解算法得到是在可行域里的最小值,因此每次求解更新这两个变量的值之后,都能保证目标函数值小于或者等于初始值,即函数值下降,所以SMO算法能保证收敛。


3、核心算法配有实现细节介绍,使用示例,知名开源库代码分析

对大部分核心算法的实现细节进行了介绍,并配有示例程序与知名开源库源代码分析,包括OpenCV,libsvm,liblinear,Caffe,这对需要使用、实现机器学习算法的读者至关重要。


精彩试读
求解器的实现是源代码分析的核心,分为可信域牛顿法与坐标下降法两类。可信域牛顿法由TRON类实现,坐标下降法由各个问题具体的求解函数实现。限于篇幅,在这里只分析一部分求解器,其他的实现原理类似。

可信域牛顿法由类TRON实现,这个类为L2-正则化logistic回归和L2-正则化支持向量机的训练提供支持。类定义如下:

class TRON

{

public:

       // 传入的是基类function的指针,可以使用上面两种损失函数,eps为迭代精度

       // max_iter为最大迭代次数,默认值为1000

       TRON(const function *fun_obj, double eps = 0.1, int max_iter = 1000);

       ~TRON();

       // 这是求解的接口函数

       void tron(double *w);

       void set_print_string(void (*i_print) (const char *buf));

private:

       int trcg(double delta, double *g, double *s, double *r); // 共轭梯度法,被tron调用

       double norm_inf(int n, double *x);

       double eps; // 收敛精度

       int max_iter; // 最大迭代次数

       function *fun_obj; // 目标函数

       void info(const char *fmt,...);

       void (*tron_print_string)(const char *buf);

};


4、重要算法的实际应用均有讲解

核心算法的实际应用都有介绍,对深度学习技术在计算机视觉、语音识别、自然语言处理、计算机图形学等领域的应用情况有详细而深入的介绍。这些内容能帮助读者掌握算法的实际应用方法、建模的思路。
file


❆购买指南

目前本书在京东上七五折包邮预售:

file

(扫码进入购买链接)


❆目录

全书由21章组成,共分为三大部分。第1~3章为第一部分,介绍机器学习的基本原理、所需的数学知识(包括微积分、线性代数、概率论和优化方法),以及机器学习中的核心概念。第4~20章为第二部分,是本书的主体,介绍各种常用的有监督学习算法、无监督学习算法、半监督学习算法和强化学习算法。对于每种算法,从原理与推导、工程实现和实际应用3个方面进行介绍,对于大多数算法,都配有实验程序。第21章为第三部分,介绍机器学习和深度学习算法实际应用时面临的问题,并给出典型的解决方案。此外,附录A给出各种机器学习算法的总结,附录B给出梯度下降法的演化关系,附录C给出EM算法的推导。

注:在极市平台公众号后台回复《机器学习与应用》即可查看完整目录列表。





欢迎各位积极留言~赢取赠书福利~

CV干货 微信公众号: 极市平台
ID: extrememart

本帖已被设为精华帖!
本帖由 Admin 于 8个月前 取消置顶
回复数量: 52
  • seiyouki 算法工程师 @ 西安华旅

    机器学习与深度学习的书看了不少,但是大多讲的方法与理论,讲实际应用的比较少,本书理论与实践相结合,值得推荐,授人以鱼不如授人以渔 :+1: :+1: :+1:

    9个月前 4
  • chengzi 学生 @ 深大

    趁实验室最近不忙,需要一本书为自己好好充电啦!!之前看过作者的机器学习算法地图,非常系统实用,希望能中这本书好好学习一下。

    9个月前 2
  • sophie 社区管理员 @ 极市平台

    雷明大神,如果数据多的话是不是用深度学习方法会更好一些呢?

    9个月前 2
  • 想问一下计算机专业本科生自学机器学习应该如何入门呢

    9个月前 1
  • 老师您好,我看了一下本书的结构,介绍的相关技术都是截止到2017年,感觉您在编写书籍的时候十分照顾我们读者,请问在学习本书的时候,对于书中的每个部分应该如何分配精力呢,因为我觉得在开始学习数学相关知识的时候就会很容易放弃,因为感觉难度有些大,导致还没有接触到深度学习本质东西的时候就会放弃,然而如果直接学习相关的框架,感觉很难理解透彻,不知道本书能否为解决这种困惑。谢谢老师

    9个月前 4
  • zhangwt3652 软件工程师 @ neusoft

    对于一个层数较深或卷积核较大的CNN目标识别网络,如何在识别精度保持不变或略有下降的前提下对网络进行剪裁优化减少运算量? 请雷明大神不吝赐教!

    9个月前 2
  • alwan 图像算法工程师 @ 广东信盛通讯科技有限公司

    雷大神,在多分类算法应用中,是如何构造多个二分类模型使其融合(这点很模糊),然后采用多数表决法或其平均值作为预测值作为输出?本书有很形象生动的图文解释二分类应用到多分类算法的样本切分展示嘛?

    9个月前 3
  • Greyson 软件工程师 @ 哈哈

    机器学习真的比传统应用厉害吗?我做图像处理还是使用opencv,不知ML到底啥样

    9个月前 3
  • 图像和表格据怎样更好的融合?可能的机器学习方法?

    9个月前 3
  • 目前许多关于机器学习的资料是关于理论部分的,实战的比较少,之前学习了吴恩达和李宏毅的机器学习课,正缺乏实际项目实战。另外,请问,作为一名在校研究生,研究方向为基于深度学习的计算机视觉,在看论文时发现许多论文没有公开代码,如何复现论文结果,并将最新的想法加入到已有算法中呢

    9个月前 3
  • 请问这本书用的是什么编程需要以及什么工具和框架啊?

    9个月前 3
  • 正在学习深度学习,并准备把它用在自己的工作中,请问老师,我应该如何根据现有的论文结合您书中的理论去实现代码呢?

    9个月前 2
  • 雷老师您好,深度学习这几年非常火,我们都知道深度学习只是机器学习的一部分,但就目前接触的一些计算机视觉领域的文章和研究成果来看,几乎都是在用深度学习,或者说用深度神经网络模型去完成某个任务,传统的机器学习方法似乎已经没有用武之地了,您对此怎么看呢?我是今年刚入学的研究生,学校开设了一些模式识别和机器学习的基础课程,从宏观上讲这些传统方法是深度学习的基础,是有必要学习和掌握的,但可能由于自己知识储备不够的缘故,总感觉传统的机器学习方法与深度学习之间比较独立,并没有特别紧密的联系,请问对这些传统的机器学习方法应该如何学习,如何在深度学习时代给它们创造应用的条件呢?

    9个月前 2
  • 雷老师您好,我是研一的学生,因为个人兴趣从建筑考到了计算机,导师给我定的方向是机器视觉,经过半年对深度学习和图像处理以及神经网络基础的的学习,我对这个放向的兴趣越来越浓,毕竟是自己喜欢的东西,就是不知道未来就业如何?还有就是圣诞节了,祝老师节日快乐!深信自己是一个中奖绝缘体,希望打破这个常规,让知识充实我吧😄

    9个月前 3
  • 如何在开放场景下提高行人检测的精度呢?

    9个月前 3
  • Hrosonchan 工业图像系统工程师 @ RICOH

    hi,雷sir。我来自某公司的数字制造部门。问题:第一个,书中是否涉及某些细节对最终的成功的影响,例如如何进行cost function的选择,有一个对比在里面。第二个,因为是一本实践的书籍,书中是否有真实的案例来讲解。

    9个月前 2
  • 雷老师您好,我是做视频事件检测的,对图像分类和检测都有所涉猎,感觉以前是各种网络结构,现在是各种组合,虽然准确率,map之类的提升了,但是大部分本质上还是没解释太清楚 为什么提升之类的,而且还难复现,感觉就像是实验跑出好结果,然后才开始编原理那样子。。。

    9个月前 2
  • 几年前跟作者好像交流过

    9个月前 1
  • 雷老师您好,我的研究方向主要是视觉相关的内容

    1. 现在在实际应用中,对于数据比较有限的情况,除了常规的旋转、随机crop、颜色shift等扩增操作以外,是否还有其它的trick,以在较小的数据集上获得相对较好的结果?

    2. 今年开始似乎学界从"how to get SOTA"转向了"why we can get SOTA",有很多文章是关于可解释性的。但目前似乎工业应用上对解释性关注程度还不是很高。
      您怎么看待这个问题?是工业界滞后于学术界,还是说工业界其实没有那么在乎模型的可解释性?
    9个月前 2
  • 雷老师你好!
    我想这本书应该是适合不同阶段读者的!对于初学者,除了公式推导原理解释还有没有课后习题?便于课后巩固知识,这样也可以作为大学教材来使用!对于实践者,有没有相关训练trick以及适用范围的介绍和为什么会有效的解释?因为我觉得这样有助于实践者更容易上手!另外,有没有经典的参考文献便于读者后期自行查找弥补知识?

    8个月前 1
  • 雷老师您好!以下是自己在学习过程中遇到了一些问题:

    1. 对于一个数据集,如何正确地进行合适地特征提取和分类器,是只能由实验结果决定还是由理论依据的,比如人脸、行人、车辆等?
    2. 因为需要将机器学习或深度学习应用到新的方向,不可避免地问题是数据集过小,因而想询问,除了常规的旋转、缩放、裁剪等方法外,是否存在更好的方法进行数据集扩充?或者训练时通过一定的技巧提高识别精度?
      麻烦雷老师了,谢谢~
    8个月前
  • 感觉这本书写得很好,想好好看看。

    8个月前
  • 雷老师您好,我们现在一般目标检测出来的结果都是一个矩形框,可以让目标检测的结果精确的框出物体,用多边形来表示吗?在算法上的改进会不会很复杂?

    8个月前
  • 大致看了下目录,我有个疑问,这本书是否适合入门者学习呢?作为入门小白,想挑一本合适的书籍,跟着目录一直走,这样比较系统全面。

    8个月前
  • 雷老师您好,我看到您书中有写到gan,正好我最近也在学习gan,所以想请教您:

    • 我阅读过一篇D2GAN的论文,构造一个生成器和两个判别器,其中一个判别器将真实噪声判别为真,另一个则是将生成图像判断为真,以此来增加生成多样性。

    但是我发现这个方法并不流行,因为我学习时日尚短,对这个模型可行性存在疑问,还请雷老师指导,谢谢老师。

    8个月前
  • studyAI 计算机社长 @ 国网技术学院

    雷老师您好,我是一名大二学生,在校是一名计算机社长,对于人工能的发展前途有很大的兴趣,想投身于此,而我发现未来市场对于人工智能的需求愈来愈大,所以我是慕名而来,希望雷老师可以给我指点一条学习的道路,也很希望得到这机器深度学习专业的书籍!感谢老师!

    8个月前
  • studyAI 计算机社长 @ 国网技术学院

    雷老师您好,我是一名大二学生在校是计算机社长一职,我注意到未来的行业发展趋势,对于人工智能人才的要求愈来愈高,因为个人喜好想投身于此,所以也是慕名而来,希望雷老师可以授人以渔,指点一下我的毕业发展方向! :heart:

    8个月前
  • 您好,我想请教以下问题,谢谢:

    • 在深度学习中如何利用知识图谱提高模型的解释性?
    • 在命名实体识别中,有什么比较好的方法实现用户词库的迁移学习?
    8个月前
  • 昨天在一个群里看到有人推荐这本书,就百度和京东看了看,内容书录确实可以,作者可谓深懂入门是的苦,很希望自己能中奖

    8个月前
  • lqueen student @ sysu

    雷老师您好,我想了解特征工程中在什么情况下需要对已收集到的特征需要进行修剪、降维呢?

    8个月前
  • 黑人 硕士研究生 @ 中山大学

    看了整本书的目录,非常系统化,对于机器学习入门及进阶都是一本非常好的书籍。对其中各个机器学习算法的详细描述非常感兴趣,还有工程化实践的相关问题,希望可以中奖~ 另外想问下雷老师,对于机器学习算法的落地应用能力的培养,除了对理论的掌握和一些具体的实践外,如何能够更加突出培养自己的竞争力呢~

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @chengzi 最近算法地图电子版已经更新,可以下载下哦

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @crysta1ovo 你好,之前我写过一篇文章《如何成为一名优秀的算法工程师》,里边仔细介绍了如何培养这几种能力:

    数学知识
    编程能力
    机器学习与深度学习的知识
    应用方向的知识
    对自己所做的问题的思考和经验

    除去教育背景,逻辑思维,学习能力,沟通能力等其他方面的因素,大多数公司在考察算法工程师的技术水平时都会考虑上面这几个因素。
    希望对你有所帮助。

    8个月前 1
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @studyAI 你好,这个问题如刚刚回答的问题一样,可以参考看看《如何成为一名优秀的算法工程师》

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @crysta1ovo 先确定你的数学、编程没有问题。可以从入门的书或者课程开始,比如斯坦福的CS229和CS231,一边学习理论,一边动手实践

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @sophie 分领域,计算机视觉,语音识别,一般用深度学习,NLP,用的也多。抽象的数据分析,比如金融数据之类的,深度学习算法的优势没有那么明显。深度学习主要解决的是感知(视觉,听觉)和决策控制问题(深度强化学习)

    8个月前 2
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @tju505 如果有时间,最好系统的学一遍,除了半监督学习,其他章节都很重要和实用

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @zhangwt3652 深度模型压缩与优化的方法一大堆,自己搜一下就知道了,剪枝与编码、低比特网络(如二值化网络),卷积核分离如mobilenet系列的。这种问题自己一搜就知道了

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @alwan 用二分类器的组合解决多分类问题,典型和实用的有1-VS-1和1-VS-剩余两种方案

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @daheman 你这问题说的太粗糙了,我没法回答

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @kuaidiyuan 这一版是c++的,下一版换成python,如果你不着急,建议等下一版,会做很多优化

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @cv_beginner 入门和提高都适合

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @zhengxinjie 一般基于已有的开源库,多看例子,github上实现论文的算法的代码很多

    8个月前
  • sophie 社区管理员 @ 极市平台

    @SIGAI_LeiMing 谢谢雷明老师的解答哈

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @jsyxharlod 不一定,经典的机器学习算法还在被广为使用,如集成学习中的xgboost。聚类算法,logistic回归,支持向量机,决策树等到现在在用,每种方法都有自己适合的问题和领域,以及优缺点

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @102ccp 先不要太担心就业问题,这不是你能决定的。你要做的,是提高自己的水平和经验。AI是互联网和科技领域现在仅存的还比较景气的方向

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @LeoFeng 做产品的话,最直接和有用的是增加训练样本集,做一些工程上的优化,当然,前提是你实现一篇比较新、有实用价值的论文上的算法

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @sharer 这种实际的trick一般书里不会写,也不适合写。这些经验可以上网搜,自己多编程多训练模型,经验就能提高

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @Jimmy1007 特征提取要根据问题的数据和特点而定,没有统一的答案,如果用深度学习,则规避了此问题。除了做样本增广,另外的就是用fine tune,或者用GAN生成样本

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @echo0714 这一版有些地方比较粗糙,有很多开源库代码分析,显得臃肿,下一版打算去了,做一些优化

    8个月前
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @Juruobudong 深度学习的理论基础,可解释性一直是被邂逅的原因

    8个月前 1
  • SIGAI_LeiMing CEO @ SIGAI-北京张量无限科技有限公司

    @黑人 除了理论和实践之外,另外的核心竞争力是对问题的深入思考,有自己的见解,灵活应用已有的方法解决学术和工程问题,创新能力

    8个月前 1
您需要登陆以后才能留下评论!