条件随机场CRF(二) 前向后向算法评估标记序列概率

2020-03-042021-05-24深度学习 / NLP11 分钟读完 (大约1668个字)

在条件随机场CRF(一)中我们总结了CRF的模型，主要是linear-CRF的模型原理。本文就继续讨论linear-CRF需要解决的三个问题：评估，学习和解码。这三个问题和HMM是非常类似的，本文关注于第一个问题：评估。第二个和第三个问题会在下一篇总结。

条件随机场

条件随机场CRF(一)从随机场到线性链条件随机场

2020-03-032021-05-24深度学习 / NLP21 分钟读完 (大约3204个字)

条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型，在自然语言处理中得到了广泛应用。本系列主要关注于CRF的特殊形式：线性链(Linear chain) CRF。本文关注与CRF的模型基础。

条件随机场

文本挖掘的分词原理

2020-03-022020-03-02深度学习 / NLP15 分钟读完 (大约2283个字)

在做文本挖掘的时候，首先要做的预处理就是分词。英文单词天然有空格隔开容易按照空格分词，但是也有时候需要把多个单词做为一个分词，比如一些名词如“New York”，需要做为一个词看待。而中文由于没有空格，分词就是一个需要专门去解决的问题了。无论是英文还是中文，分词的原理都是类似的，本文就对文本挖掘时的分词原理做一个总结。

分词, Viterbi

optimize water distribution in a village

2020-02-202020-02-20LeetCode9 分钟读完 (大约1360个字)

题目地址

https://leetcode.com/problems/optimize-water-distribution-in-a-village/

动态规划

自动群发邮件

2020-02-192020-02-19Python4 分钟读完 (大约563个字)

利用Python实现自动发送邮件

脚本, 邮件

4种不同颜色的色块，它们的颜色真的不同吗

2020-02-182020-02-18Python10 分钟读完 (大约1484个字)

背景介绍

在上面这幅背景为灰色的图片中（使用turtle绘制），我们看到了4种不同颜色的色块。它们的颜色真的不同吗？

答案是否定的。

turtle

异构计算， GPU和框架选型指南

2020-02-102021-05-24深度学习1 小时读完 (大约8320个字)

深度学习训练和推理的过程中，会涉及到大量的向量(vector)，矩阵(matrix)和张量(tensor)操作，通常需要大量的浮点计算，包括高精度（在训练的时候）和低精度（在推理和部署的时候）。GPU，作为一种通用可编程的加速器，最初设计是用来进行图形处理和渲染功能，但是从2007年开始，英伟达(NVIDIA)公司提出了第一个可编程通用计算平台（GPU），同时提出了CUDA框架，从此开启了GPU用于通用计算的新纪元。此后，不计其数的科研人员和开发者，对各种不同类型的算法用CUDA进行（部分）改写，从而达到几倍到数百倍的加速效果。尤其是在机器学习，特别是深度学习的浪潮来临后，GPU加速已经是各类工具实现的基本底层构架之一。本章里，会简单介绍GPU的基本架构，性能指标，框架选择等等和深度学习相关的内容。

GPU, CPU

梯度提升树(GBDT)原理小结

2020-02-042021-05-24机器学习24 分钟读完 (大约3539个字)

在集成学习之Adaboost算法原理小结中，我们对Boosting家族的Adaboost算法做了总结，本文就对Boosting家族中另一个重要的算法梯度提升树(Gradient Boosting Decison Tree, 以下简称GBDT)做一个总结。GBDT有很多简称，有GBT（Gradient Boosting Tree）, GTB（Gradient Tree Boosting ）， GBRT（Gradient Boosting Regression Tree）, MART(Multiple Additive Regression Tree)，其实都是指的同一种算法，本文统一简称GBDT。GBDT在BAT大厂中也有广泛的应用，假如要选择3个最重要的机器学习算法的话，个人认为GBDT应该占一席之地。

GBDT

Attention机制

2019-12-162021-05-24深度学习 / NLP22 分钟读完 (大约3232个字)

Encoder-Decoder

所谓encoder-decoder模型，又叫做编码-解码模型。这是一种应用于seq2seq问题的模型。

什么是seq2seq呢？简单的说，就是根据一个序列x，来生成另一个输出序列y。seq2seq有很多应用，例如翻译，文档摘要，问答系统等等。在翻译中，输入序列是待翻译的文本，输出序列是翻译后的文本；在问答系统中，输入序列是提出的问题，而输出序列是答案。

Attention, Seq2seq

GloVe数学原理详解

2019-12-132021-05-24深度学习 / NLP18 分钟读完 (大约2688个字)

什么是GloVe？

正如论文的标题而言，GloVe的全称叫Global Vectors for Word Representation，它是一个基于全局词频统计（count-based & overall statistics）的词表征（word representation）工具，它可以把一个单词表达成一个由实数组成的向量，这些向量捕捉到了单词之间一些语义特性，比如相似性（similarity）、类比性（analogy）等。我们通过对向量的运算，比如欧几里得距离或者cosine相似度，可以计算出两个单词之间的语义相似性。

Word representation, 数学原理, GloVe

条件随机场CRF(二) 前向后向算法评估标记序列概率

条件随机场CRF(一)从随机场到线性链条件随机场

文本挖掘的分词原理

optimize water distribution in a village

题目地址

自动群发邮件

4种不同颜色的色块，它们的颜色真的不同吗

背景介绍

异构计算， GPU和框架选型指南

梯度提升树(GBDT)原理小结

Attention机制

Encoder-Decoder

GloVe数学原理详解

什么是GloVe？

广告

分类

最新文章