自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 Kmeans聚类算法求解与实现
原力计划

在上一篇文章中,笔者介绍了KmeansKmeansKmeans聚类算法的主要思想与原理,并且还得到了其对应的目标函数。在接下来的这篇文章中笔者就开始介绍KmeansKmeansKmeans聚类算法的求解过程,以及其对应的代码实现。 跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注...

2020-06-29 09:09:12 176 0

原创 没有你看不懂的Kmeans聚类算法
原力计划

1 引例 经过前面一些列的介绍,我们已经接触到了多种回归和分类算法。并且这些算法有一个共同的特点,那就是它们都是有监督的(supervised)学习任务。接下来,笔者就开始向大家介绍一种无监督的(unsupervised) 经典机器学习算法——聚类。同时,由于笔者仅仅只是对Kmeans框架下的聚类...

2020-06-23 09:08:38 261 0

原创 SVM之目标函数求解
原力计划

经过前面几篇文章的介绍,我们知道了支持向量机背后的原理。同时,为了求解SVM中的目标函数,我们还在前面两篇文章中陆续介绍了拉格朗日乘数法和对偶性问题。接下来,在这篇文章中将开始正式介绍SVM的求解过程。 1 构造广义拉格朗日函数L(w,b,α)\mathcal{L}(w,b,\alpha)L(w,...

2020-06-20 09:21:18 169 0

原创 对偶性与KKT条件
原力计划

在**上一篇文章中,笔者介绍了什么是拉格朗日乘数法以及它的作用。同时在那篇文章中笔者还特意说到,拉格朗日乘数法只能用来求解等式约束条件下**的极值。但是当约束条件为不等式的时候我们又该如何求解呢? 1 广义拉格朗日乘数法 由拉格朗日乘数法可知,对于如下等式条件的约束问题 min⁡w      f(...

2020-06-18 09:37:17 169 0

原创 好久不见的拉格朗日乘数法
原力计划

1 引例 我想大多数人对于朗格朗日乘数法的学习已经是好多年前的事情,其中的细节也自然是慢慢模糊了起来,但是对于它的作用我想几乎是不会忘记的,那就是用来求解条件极值。既然大多数人的记忆都停留在这个地方,那么我们就从这个开始重新拾起拉格朗日乘数法。下面就以一个例题来重温一下求解过程: 求解目标函数z=...

2020-06-18 09:33:20 94 0

原创 SVM之软间隔最大化
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面几篇文章中,笔者分别介绍了什么是支持向量机以及如何通过sklearn来完成一个简单的SVM建模;接着还介绍了什么是线性不可分与核函数。在接下来的这篇文章中,笔者将继续介绍SVM中的软间隔与sklearn相关SVM模型的实现...

2020-06-16 09:23:45 192 0

原创 SVM之线性不可分与核技巧
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面两篇文章中,笔者通过两个角度来介绍了什么是支持向量机。不过说一千道一万,还是不如动手来做做。在本篇文章中,笔者将首先介绍如何通过sklearn来搭建相应的SVM分类模型,然后将接着介绍如何处理SVM中的线性不可分问题。 1...

2020-06-13 11:00:28 221 0

原创 从另一个角度看支持向量机
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在上一篇文章中,笔者介绍了什么是支持向量机以及如何来建模对应的优化问题,且同时那也是一种主流的理解支持向量机的视角。下面,笔者再来从另外一个角度来介绍什么是支持向量机。这两种理解支持向量机的方法有着截然不同的切入点,因此可以一起...

2020-06-11 08:18:04 141 0

原创 原来这就是支持向量机
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面一系列的文章中,我们已经学习了多种分类算法模型,对于机器学习算是有了一定的了解。在接下来的几篇文章中,我们将开始逐步介绍《跟我一起机器学习》中的最后一个分类模型——支持向量机。**支持向量机(Support Vector ...

2020-06-08 15:51:44 160 0

原创 泰坦尼克号沉船生还预测
原力计划

在前面的几篇文章中,笔者陆续介绍了几种决策树的生成算法以及常见的集成模型。接下来在这篇文章中,笔者将以泰坦尼克号生还预测(分类)为例来进行实战演示;并且还会介绍相关的数据预处理方法,例如缺失值填充和类型特征转换等。 1 数据集预处理 我们本次用到的数据集为泰坦尼克号生还预测数据集(公众号回复”数据...

2020-06-05 18:33:47 165 2

原创 随机森林在sklearn中的使用
原力计划

在上一篇文章中,笔者介绍了常见集成模型的主要思想,并且还提到随机森林是使用最为广泛的集成模型之一。因此在本篇文章中,笔者将会再次就随机森林的其它应用以及其在sklearn中的具体用法进行介绍。 1 API介绍 在上一篇文章中,我们介绍了随机森林的基本原理,但并没有对其的具体用法做出详细的示例。接下...

2020-06-04 10:19:37 251 0

原创 集成模型:Bagging、Boosting和Stacking
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 1 引例 通过前面几篇文章的学习,我们已经了解了机器学习中的多种分类和回归模型。那现在有一个问题就是,哪一个模型最好呢?以分类任务为例,当我们拿到一个需要进行分类的任务时,如果是你你会选择哪种模型进行建模呢?一个狡猾的办法就是挨...

2020-06-03 08:24:18 190 0

原创 决策树的生成与剪枝CART
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在之前的一篇文章中,笔者分别介绍了用ID3和C4.5这两种算法来生成决策树。其中ID3算法每次用信息增益最大的特征来划分数据集,C4.5算法每次用信息增益比最大的特征来划分数据集。接下来,我们再来看另外一种采用基尼指数为标准的划...

2020-06-02 08:27:27 240 0

提示
确定要删除当前文章?
取消 删除