自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 一站式文本标注工具doccano(你值得拥有)

1 前言 今天要介绍的是一款开源的语料标注工具doccano[1]。对于NLP中常见的情感分类、命名体识别、序列到序列等的数据标注任务都可以通过doccano来完成。由于工作的关系,笔者还看到一些厂商的标注工具也是基于doccano开发的。在这个项目的另一个主页中[2],作者也介绍了该项目的四种不...

2020-09-29 08:24:41 224 0

原创 LeNet5的继任者AlexNet模型

1 前言 在之前的文章中我们多次谈到,如何有效的对输入数据进行特征提取,然后再将提取得到的特征输入到下游的任务模型中是深度学习中的一个重要研究方向。尤其是在图像处理这个领域中,自卷积操作问世以来,如何设计一个有效的卷积神经网络结构就成为了一个热门的研究点。研究者们通过设计不同架构的卷积网络来对输入...

2020-11-24 11:37:46 11 0

原创 我开源了这份超十万字200多页的机器学习笔记

为什么会有这份笔记 记得笔者大约是在三年前开始接触机器学习,也正是在那个时间附近件,笔者越发的认为“要想学得好,笔记不能少”。于是,在这之后笔者每每学完一个新的知识点都会选择将它记录下来。慢慢的,不知不觉就记录近200篇博客,内容从机器学习到深度学习、从编程语言到开源框架等,只要是接触过的笔者都会...

2020-11-17 12:16:14 31 0

原创 卷积池化与LeNet5网络模型

1 前言 经过前面三篇文章的介绍,我们已经知道了卷积的原理、卷积的计算过程以及池化的原理和过程等。在接下来的这篇文章中,笔者将开始介绍如何通过Pytorch这一深度学习框架来实现卷积和池化的操作,以及各个API的使用介绍和说明。最后,笔者还会介绍卷积神经网络的入门级网络结构LeNet5,我们也将会...

2020-11-11 08:17:59 109 0

原创 跑代码时ssh中断怎么恢复?

1 前言 今天要和大家介绍的是一个在Linux系统中人称挂机神器的screen工具。为什么我们会需要这个工具呢?请匹配自己在通过ssh远程连接服务器的时候是否出现过以下烦恼: 正在运行某个程序,由于网络不好ssh突然中断了,再次连接ssh后发现程序进程还在后台,但就是恢复不到程序的运行界面; 运...

2020-10-15 08:19:01 54 0

原创 Xshell服务器远程连接利器

今天要介绍的一款软件叫做Xshell,它的主要作用呢就方便快捷的连接远程服务器,以及建立一个同服务器进行文件传输的通道。之所以会用到这个软件是因为在后续的学习中,我们基本上都会通过服务器主机来进行代码的运行,因此难免就会与主机之间进行文件的传输等等。因此,在这篇文章中,笔者将首先介绍一下如何与远程...

2020-10-13 08:22:11 58 0

原创 一台没网的主机怎么配置GPU环境?

1 前言 什么样的环境配置需要一整天呢?答,在一台内网服务器上且没有内部Python可用源的情况下安装CUDA驱动+Tensorflow需要整整一天。 前段时间同事申请的一台主机上周到了,说让笔者来配置一下环境。拿到账号后第一时间登陆上去,并使用了nvidia-smi来查看是否配有显卡。结果提示找...

2020-09-10 22:27:28 70 0

原创 我告诉你什么是深度学习

1 引言 在之前的文章你告诉我什么是深度学习中,笔者从线性回归中的房价预测、到梯形块儿的面积介绍了输入特征对于模型预测的重要性;接着又从特征提取以及非线性变换的角度介绍了特征提取对于模型的重要性;最后我们从单层神经网络(线性回归模型)顺利的过渡到了多层神经网络,也就是深度学习的概念中。在接下来的这...

2020-09-08 21:33:17 42 0

原创 Pytorch之简洁版Softmax多分类

在上一篇文章中,我们自己手动实现了对于softmax操作和交叉熵的计算,可其实这些在Pytorch框架中已经被实现了,我们直接拿来使用即可。但是,为了能够对这些内容有着更深刻的理解,通常我们都会自己手动实现一次,然后在今后的使用中就可以直接拿现成的来用了。在接下来这篇文章中,笔者将首先介绍如何调用...

2020-09-01 08:31:58 126 0

原创 听说你还在使用破解版Pycharm?

1 引言 在用python做编码的过程中大多数人都会选择Pycharm来作为IDE使用,并且免费的教育版和社区版几乎就能满足满足绝大多数情况下的需求。但是,通常来说我们都需要快捷的将本地代码部署到服务器上进行实验,而连接服务器这一功能又恰好只对专业版开放。因此,对于专业版的破解就显得尤为必要。 笔...

2020-08-28 08:20:05 213 0

原创 Pytorch之Softmax多分类任务

在上一篇文章中,笔者介绍了什么是Softmax回归及其原理。因此在接下来的这篇文章中,我们就来开始动手实现一下Softmax回归,并且最后要完成利用Softmax模型对Fashion MINIST进行分类的任务。在开始实现Softmax之前,我们先来了解一下Fashion MINIST这一数据集。...

2020-08-25 13:12:50 162 0

原创 想明白多分类,必须得谈逻辑回归

1 引例 在 《跟我一起机器学》 中,我们已经介绍了什么是逻辑回归回归。但是为了能更好的与深度学习相关内容进行衔接,在本篇文章中我们依旧是首先回顾一下逻辑回归,然后再一步步引入多分类直至过渡到深度神经网络的相关学习中。 1.1 从逻辑回归说起 我们都知道逻辑回归其实并不是一个回归任务,而是一个彻彻...

2020-08-20 22:08:10 63 0

原创 Pytorch之Linear与MSELoss

在前面我们介绍了如何用Pytorch来实现一个两层的神经网络,但是其编码过程略微显得有点复杂。例如我们要手动自己定义权重参数,自己书写如何进行梯度更新等等。但要是某个网络多达几十层,那这个工作量显然是巨大的。因此,将一些常用的操作定义成更高级的API接口也是每个深度学习框架应该包含的东西。下面,在...

2020-08-12 22:20:12 109 0

原创 这样拟合正弦函数你会吗

为了加深大家对深度学习这一概念的理解,尤其是对深度(多层神经网络) 两个字的认识,笔者在本篇文章中将会通过一个拟合正弦函数例子再次介绍“深度”这一概念。但巧妇难为无米之炊,所以接下来笔者首先会以线性回归的实现为例,来简单介绍一下Pytorch;然后再来实现对正弦函数的拟合。 1 动手实现线性回归 ...

2020-08-06 20:17:16 141 0

原创 你告诉我什么是深度学习

1 引例 经过前面在《跟我一起机器学习》中一系列的介绍,我们终于进入到了深度学习。那什么又是深度学习呢?以及我们为什么需要深度学习呢?要想弄清楚这两个问题,我们还得从机器学习的入门 线性回归 说起。如果之前一点没有接触过机器学习,并且也不打算研究机器学习,那么请至少阅读 《跟我一起机器学习》 中前...

2020-08-04 20:59:19 94 0

原创 Tensorflow实现深度前馈神经网络

1 前言 在前面两篇文章中,笔者分别介绍了如何用Tensorflow来实现 线性回归 和 Softmax回归,并且这两个模型有一个共同点就是均为单层的神经网络。那我们应该如何通过Tensorflow来实现一个多层的神经网络呢?有朋友可能就会说了,会写单层的难道还不会写多层了?确实,按照先前的做法:...

2020-07-24 22:22:18 147 0

原创 Tensorflow一个规范的网络模型示例

1 前言 在前面两篇文章中,笔者分别介绍了如何用Tensorflow来实现线性回归和Softmax回归,并且这两个模型有一个共同点就是均为单层的神经网络。那我们应该如何通过Tensorflow来实现一个多层的神经网络呢?有朋友可能就会说了,会写单层的难道还不会写多层了?确实,按照先前的做法:首先定...

2020-07-22 08:06:37 98 0

原创 Tensorflow实现Softmax回归

1 前言 在 上一篇文章 中笔者介绍了如何通过Tensorflow来实现线性回归。在接下来的这篇文章中,笔者将会以Fashion MNIST数据集为例来介绍如何用Tensorflow实现一个Softmax多分类模型。在这篇文章中,我们会开始慢慢接触到Tensoflow中用于实现分类模型的API,例...

2020-07-20 19:44:54 116 0

原创 Tensorflow实现线性回归

1 前言 在介绍Tensorflow的过程中,笔者并不会想其它书本一样先依次介绍各种API的作用,然后再来搭建一个模型。这种介绍顺序往往会使你在看API介绍时可能不会那么耐烦,因此在今后笔者将会先搭建出模型,再来介绍其中各个API的作用,即带着目的来进行学习。 在接下来的这篇文章中,我们将以波士顿...

2020-07-17 14:00:36 133 3

原创 简单谈谈Tensorflow的运行机制
原力计划

1 前言 由于Tensorflow采用了全新的静态图设计模式,所以其运行机制与我们脑中所熟悉的动态图有着截然不同之处。TensorFlow翻译成中文就是张量流,所以TensorFlow至少代表着两个概念:“张量”和“流”。这儿我们不过多的追究什么是张量,在Tensorflow中它基本上就相当于nu...

2020-07-15 08:17:25 113 0

原创 你们要的Tensorflow入坑指南来了

1 前言 磨磨蹭蹭三个多月,总算是把 《跟我一起机器学习》 这个系列的文章差不多给更新完了,虽然内容不多但还都算是一些比较基础的算法模型。那接下来又来写点啥呢?最近看到群里好几位同学都在吐槽Tensorflow比较难用,不对是相当难用(针对的是1.x版本)。其实说来也是,记得笔者当初在初学Ten...

2020-07-13 08:40:23 113 0

原创 如何用聚类的思想做预测

1 前言 这段时间不断收到有人私信问没有标签的数据集怎么做预测,因此在这篇文章中笔者就来简单说说处理这类问题方法。在正式解决这个问题我们先来探究一下他们为什么会这么问呢?仔细想想问题应该是出在“没有标签”上,试想一下如果是一个有标签数据集,那么肯定不会有人这么问。因此,这个问题其实就变成了无监督学...

2020-07-08 22:58:25 309 0

原创 WKmeans一种基于特征权重的聚类算法
原力计划

1 引例 在前面两篇文章中,我们首先介绍了KmeansKmeansKmeans聚类算法的原理;然后又介绍了一种基于KmeansKmeansKmeans进行改进的Kmeans++Kmeans++Kmeans++聚类算法,该算法的改进点在于依次初始化KKK个簇中心,最大程度上使得不同的簇中心彼此之间相...

2020-07-06 08:36:33 683 0

原创 几种常见的聚类评估指标
原力计划

在前面两篇文章中,笔者已经介绍了两种聚类算法,同时还通过sklearn完成相应的示例。但是,到目前为止笔者还没有介绍如何来聚类的经过进行评估。这接下来的这篇文章中,笔者将会介绍在聚类算法中几种常见的评估指标,以及其中两种相应的原理。同时,如果不用关系其具体计算过程的,可以直接阅读第三部分即可。 如...

2020-07-03 08:37:25 687 2

原创 Kmeans++聚类算法原理与实现
原力计划

1 引例 在上一篇文章中,笔者介绍了什么是聚类算法,并且同时还介绍了聚类算法中应用最为广泛的KmeansKmeansKmeans聚类算法。从KmeansKmeansKmeans聚类算法的原理可知,KmeansKmeansKmeans在正式聚类之前首先需要完成的就是初始化kkk个簇中心。同时,也正是...

2020-07-01 08:47:37 226 0

原创 Kmeans聚类算法求解与实现
原力计划

在上一篇文章中,笔者介绍了KmeansKmeansKmeans聚类算法的主要思想与原理,并且还得到了其对应的目标函数。在接下来的这篇文章中笔者就开始介绍KmeansKmeansKmeans聚类算法的求解过程,以及其对应的代码实现。 跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注...

2020-06-29 09:09:12 176 0

原创 没有你看不懂的Kmeans聚类算法
原力计划

1 引例 经过前面一些列的介绍,我们已经接触到了多种回归和分类算法。并且这些算法有一个共同的特点,那就是它们都是有监督的(supervised)学习任务。接下来,笔者就开始向大家介绍一种无监督的(unsupervised) 经典机器学习算法——聚类。同时,由于笔者仅仅只是对Kmeans框架下的聚类...

2020-06-23 09:08:38 261 0

原创 SVM之目标函数求解
原力计划

经过前面几篇文章的介绍,我们知道了支持向量机背后的原理。同时,为了求解SVM中的目标函数,我们还在前面两篇文章中陆续介绍了拉格朗日乘数法和对偶性问题。接下来,在这篇文章中将开始正式介绍SVM的求解过程。 1 构造广义拉格朗日函数L(w,b,α)\mathcal{L}(w,b,\alpha)L(w,...

2020-06-20 09:21:18 169 0

原创 对偶性与KKT条件
原力计划

在**上一篇文章中,笔者介绍了什么是拉格朗日乘数法以及它的作用。同时在那篇文章中笔者还特意说到,拉格朗日乘数法只能用来求解等式约束条件下**的极值。但是当约束条件为不等式的时候我们又该如何求解呢? 1 广义拉格朗日乘数法 由拉格朗日乘数法可知,对于如下等式条件的约束问题 min⁡w      f(...

2020-06-18 09:37:17 169 0

原创 好久不见的拉格朗日乘数法
原力计划

1 引例 我想大多数人对于朗格朗日乘数法的学习已经是好多年前的事情,其中的细节也自然是慢慢模糊了起来,但是对于它的作用我想几乎是不会忘记的,那就是用来求解条件极值。既然大多数人的记忆都停留在这个地方,那么我们就从这个开始重新拾起拉格朗日乘数法。下面就以一个例题来重温一下求解过程: 求解目标函数z=...

2020-06-18 09:33:20 94 0

原创 SVM之软间隔最大化
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面几篇文章中,笔者分别介绍了什么是支持向量机以及如何通过sklearn来完成一个简单的SVM建模;接着还介绍了什么是线性不可分与核函数。在接下来的这篇文章中,笔者将继续介绍SVM中的软间隔与sklearn相关SVM模型的实现...

2020-06-16 09:23:45 192 0

原创 SVM之线性不可分与核技巧
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面两篇文章中,笔者通过两个角度来介绍了什么是支持向量机。不过说一千道一万,还是不如动手来做做。在本篇文章中,笔者将首先介绍如何通过sklearn来搭建相应的SVM分类模型,然后将接着介绍如何处理SVM中的线性不可分问题。 1...

2020-06-13 11:00:28 221 0

原创 从另一个角度看支持向量机
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在上一篇文章中,笔者介绍了什么是支持向量机以及如何来建模对应的优化问题,且同时那也是一种主流的理解支持向量机的视角。下面,笔者再来从另外一个角度来介绍什么是支持向量机。这两种理解支持向量机的方法有着截然不同的切入点,因此可以一起...

2020-06-11 08:18:04 141 0

原创 原来这就是支持向量机
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面一系列的文章中,我们已经学习了多种分类算法模型,对于机器学习算是有了一定的了解。在接下来的几篇文章中,我们将开始逐步介绍《跟我一起机器学习》中的最后一个分类模型——支持向量机。**支持向量机(Support Vector ...

2020-06-08 15:51:44 160 0

原创 泰坦尼克号沉船生还预测
原力计划

在前面的几篇文章中,笔者陆续介绍了几种决策树的生成算法以及常见的集成模型。接下来在这篇文章中,笔者将以泰坦尼克号生还预测(分类)为例来进行实战演示;并且还会介绍相关的数据预处理方法,例如缺失值填充和类型特征转换等。 1 数据集预处理 我们本次用到的数据集为泰坦尼克号生还预测数据集(公众号回复”数据...

2020-06-05 18:33:47 165 2

原创 随机森林在sklearn中的使用
原力计划

在上一篇文章中,笔者介绍了常见集成模型的主要思想,并且还提到随机森林是使用最为广泛的集成模型之一。因此在本篇文章中,笔者将会再次就随机森林的其它应用以及其在sklearn中的具体用法进行介绍。 1 API介绍 在上一篇文章中,我们介绍了随机森林的基本原理,但并没有对其的具体用法做出详细的示例。接下...

2020-06-04 10:19:37 251 0

原创 集成模型:Bagging、Boosting和Stacking
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 1 引例 通过前面几篇文章的学习,我们已经了解了机器学习中的多种分类和回归模型。那现在有一个问题就是,哪一个模型最好呢?以分类任务为例,当我们拿到一个需要进行分类的任务时,如果是你你会选择哪种模型进行建模呢?一个狡猾的办法就是挨...

2020-06-03 08:24:18 190 0

原创 决策树的生成与剪枝CART
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在之前的一篇文章中,笔者分别介绍了用ID3和C4.5这两种算法来生成决策树。其中ID3算法每次用信息增益最大的特征来划分数据集,C4.5算法每次用信息增益比最大的特征来划分数据集。接下来,我们再来看另外一种采用基尼指数为标准的划...

2020-06-02 08:27:27 240 0

原创 决策树的建模与剪枝
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面的两篇文章中,笔者首先介绍了决策树的基本思想;然后接着介绍了两种用于构建决策树的生成算法:ID3和C4.5。在这篇文章中,笔者将将通过sklearn库来实现对决策树分类算法的建模。 1 Scikit-learn建模 1.1...

2020-05-29 15:08:42 285 0

原创 决策树的生成之ID3与C4.5算法
原力计划

跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 1 基本概念 在正式介绍决策树的生成算法前,我们先将上一篇文章中介绍的几个概念重新梳理一下;并且同时再通过一个例子来熟悉一下计算过程,以便于后续更好的理解决策树的生成算法。 1.1 信息熵 设XXX是一个取值为有限个的离散型随机...

2020-05-27 18:53:34 108 0

提示
确定要删除当前文章?
取消 删除