标识符
关键字(25个)
1 | if for func case struct import |
1 | if for func case struct import |
BERT
基本原理BERT:Bidirectional Encoder Representations from Transformers
Transformer
的编码器;由12层或更多的EncoderLayer
组成 HMM
生成模型给定句子 \(S\),对应的输出词性序列 \(T\),HMM
模型的联合概率: \[
\begin{align}
P(T|S) &= \frac{P(S|T)\cdot P(T)}{P(S)}\\
P(S,T) &= P(S|T)\cdot P(T)\\
&= \prod_{i=1}^{n}P(w_i|T)\cdot P(T)\\
&= \prod_{i=1}^{n}P(w_i|t_i)\cdot P(T)\\
&= \prod_{i=1}^{n}P(w_i|t_i)\cdot P(t_i|t_{i-1})\\
\end{align}
\]
1 | import numpy as np |
CRF
原理条件随机场(conditional_random_field)
,是一类判别型算法,特别适合于预测任务,任务中的 上下文信息或临近状态会影响当前状态 。如序列标注任务: >判别式模型(discriminative model)
计算条件概率,而生成式模型(generative model)
计算联合概率分布
使用蒙特卡洛方法不需要像DP一样,对环境要有完整的知识,而是通过经验去学习。所谓经验就是对状态、动作、奖励的采样(sample sequence)。
用sample的均值去近似期望。