C++Primer

对于一个句子，我们要做的是给每一个单词打上词性标记，比如句子the dog saw a cat对应的tag sequence是D N V D N，这个句子的长度是5，对应的输入\(x_1=the,x_2=dog,x_3=saw,x_4=the,x_5=cat\)，用\(y_1y_2...y_n\)来表示tagging model的output，对应上面的有\(y_1=D,y_2=N,y_3=V,...\)。匹配句子\(x_1...x_n\)的tag sequence \(y_1...y_n\)的问题叫做 sequence labeling problem 或者是 tagging problem。

HMM, Tagging

Language Modeling

2017-11-182019-12-13深度学习 / NLP9 分钟读完 (大约1307个字)

N-Gram

这里首先有个语料库，记录了很多条句子，然后预测给定句子出现的概率。给定一个句子，这里句子的长度为n，也就是\(|V|=n\)，第i个单词用字母\(x_i\)表示，那么概率公式表示为：\(P(X_1=x_1,X_2=x_2,...X_n=x_n)\)

笔记, 语言模型

Numpy笔记

2017-10-072019-11-18Python13 分钟读完 (大约1912个字)

numpy的属性

shape返回一个元组分别记录着行数与列数
size返回矩阵元素的个数
ndim返回行数
A.T返回矩阵的反向矩阵

numpy

动态规划专题

2017-09-232019-11-18LeetCode1 小时读完 (大约7593个字)

DP 问题的一般思路

DP 定义 ——有时 DP 的更新很难严格遵循定义，需要额外变量保存全局最优结果
初始化 ——初始值可以通过一个简单的特例来确定
递推公式 + 边界条件
DP 优化 （可选）

Reference

常见的动态规划问题分析与求解 - 五岳 - 博客园
什么是动态规划？动态规划的意义是什么？ - 知乎

动态规划, 专题

Python惯例

2017-07-082019-12-26Python4 分钟读完 (大约648个字)

“惯例”这个词指的是“习惯的做法，常规的办法，一贯的做法”，与这个词对应的英文单词叫“idiom”。由于Python跟其他很多编程语言在语法和使用上还是有比较显著的差别，因此作为一个Python开发者如果不能掌握这些惯例，就无法写出“Pythonic”的代码。下面我们总结了一些在Python开发中的惯用的代码。

Python

Pandas 学习

2017-07-022021-06-08Python1 小时读完 (大约7601个字)

该笔记摘录自微信公众号“每天进步一点点2015”的文章《Python数据分析之pandas学习（一）》和《Python数据分析之pandas学习（二）》。我对代码和讲解中不够清晰的地方进行了一些改动和补充。

笔记

使效率倍增的Pandas使用技巧

2017-07-012021-06-08Python1 小时读完 (大约7911个字)

本文取自Analytics Vidhya的一个帖子12 Useful Pandas Techniques in Python for Data Manipulation，浏览原帖可直接点击链接，中文版可参见Datartisan的用 Python 做数据处理必看：12 个使效率倍增的 Pandas 技巧。这里主要对帖子内容进行检验并记录有用的知识点。

笔记

C++Primer

变量

类型

Lexicalized Probabilistic Context-Free Grammars

Weaknesses of PCFGs as Parsing Models

Probabilistic Context-Free Grammars

Context-Free Grammars

Tagging Problems and Hidden Markov Models

概述

Language Modeling

N-Gram

Numpy笔记

numpy的属性

动态规划专题

DP 问题的一般思路

Reference

Python惯例

Pandas 学习

使效率倍增的Pandas使用技巧

广告

分类

最新文章