标识符

2021-06-092021-06-10Golang8 分钟读完 (大约1248个字)

关键字（25个）

if      for     func    case        struct      import               
go      type    chan    defer       default     package
map     const   else    break       select      interface
var     goto    range   return      switch      continue     fallthrough

笔记

BERT基本原理及运用

2021-06-062021-06-06自然语言处理1 小时读完 (大约6709个字)

`BERT`基本原理

BERT:Bidirectional Encoder Representations from Transformers

BERT架构

自编码语言模型，模型结构为 Transformer 的编码器；由12层或更多的EncoderLayer组成

Bert

基于HMM和Viterbi算法的序列标注

2021-06-062021-06-06自然语言处理26 分钟读完 (大约3944个字)

`HMM`生成模型

给定句子 \(S\)，对应的输出词性序列 \(T\)，HMM模型的联合概率： \[ \begin{align} P(T|S) &= \frac{P(S|T)\cdot P(T)}{P(S)}\\ P(S,T) &= P(S|T)\cdot P(T)\\ &= \prod_{i=1}^{n}P(w_i|T)\cdot P(T)\\ &= \prod_{i=1}^{n}P(w_i|t_i)\cdot P(T)\\ &= \prod_{i=1}^{n}P(w_i|t_i)\cdot P(t_i|t_{i-1})\\ \end{align} \]

HMM, Viterbi

Transformer模型及源代码

2021-06-052021-06-06自然语言处理32 分钟读完 (大约4779个字)

import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import math, copy, time
from torch.autograd import Variable
import matplotlib.pyplot as plt
import seaborn
seaborn.set_context(context='talk')
%matplotlib inline

Transformer

词表征与词向量

2021-06-032021-06-06自然语言处理25 分钟读完 (大约3765个字)

词表征(Word Representation)

文本数据经过预处理后，需要转化成数值特征，便于后续处理

词表征, 词向量

BiLSTM和CRF算法的序列标注原理

2021-06-022021-06-06自然语言处理32 分钟读完 (大约4816个字)

`CRF`原理

条件随机场(conditional_random_field)，是一类判别型算法，特别适合于预测任务，任务中的 上下文信息或临近状态会影响当前状态 。如序列标注任务： >判别式模型(discriminative model)计算条件概率，而生成式模型(generative model)计算联合概率分布

BiLSTM, CRF

n-step Bootstrapping

2021-06-012021-06-01强化学习5 分钟读完 (大约732个字)

n-step Bootstrapping简介

是MC方法和一步TD方法的结合。
是资格痕迹（eligibility traces，具体见第12章）的基础先验知识。

笔记, Bootstrapping

Temporal-Difference Learning

2021-05-312021-05-31强化学习4 分钟读完 (大约652个字)

时序差分（Temporal-Difference）简介

时序差分是强化学习的核心观点。
时序差分是DP和MC方法的结合。
MC要等一个完整的序列结束，比如玩21点扑克，直到玩完才能知道是胜是负；相反，时序差分每经历一步，都会更新价值函数，因为每一步都会观察到一个新的Reward，比如Grid World，每走一步都知道reward是什么。
TD往往比MC高效；TD和MC都使用经验（experience）来解决预测问题。
所谓差分就是下一个时刻的估计和当前时刻的估计的差。

笔记, Temporal-Difference

Monte Carlo Methods

2021-05-312021-05-31强化学习11 分钟读完 (大约1637个字)

蒙特卡洛方法简介

使用蒙特卡洛方法不需要像DP一样，对环境要有完整的知识，而是通过经验去学习。所谓经验就是对状态、动作、奖励的采样（sample sequence）。

用sample的均值去近似期望。

笔记, Monte Carlo

第一篇监督学习

2021-05-232021-05-2921 分钟读完 (大约3181个字)

统计学习或机器学习一般包括监督学习、无监督学习、强化学习，有时还包括半监督学习、主动学习

监督学习

监督学习指从标注数据中学习预测模型的机器学习问题，其本质是学习输入到输出的映射的统计规律。
输入变量\(X\)和输出变量\(Y\)有不同的类型，可以是连续或是离散的。根据输入输出变量的不同类型，对预测任务给予不同的名称：输入与输出均为连续变量的预测问题称为回归问题；输出变量为有限个离散变量的预测问题称为分类问题；输入与输出变量均为变量序列的预测问题称为标注问题。

统计学习方法, 监督学习

标识符

关键字（25个）

BERT基本原理及运用

`BERT`基本原理

BERT架构

基于HMM和Viterbi算法的序列标注

`HMM`生成模型

Transformer模型及源代码

词表征与词向量

词表征(Word Representation)

BiLSTM和CRF算法的序列标注原理

`CRF`原理

n-step Bootstrapping

n-step Bootstrapping简介

Temporal-Difference Learning

时序差分（Temporal-Difference）简介

Monte Carlo Methods

蒙特卡洛方法简介

第一篇监督学习

监督学习

广告

分类

最新文章

关键字（25个）

BERT基本原理

BERT架构

HMM生成模型

词表征(Word Representation)

CRF原理

n-step Bootstrapping简介

时序差分（Temporal-Difference）简介

蒙特卡洛方法简介

监督学习

广告

分类

最新文章

`BERT`基本原理

`HMM`生成模型

`CRF`原理