自然语言处理之动手学词向量(word embedding)视频教程资源介绍:
本课程从One-hot编码开始,word2vec、fasttext到glove讲解词向量技术的方方面面,每个技术点环节都有相应的小案例,以更加巩固相应知识。词向量(Word embedding)是深入学习技术在自然语言处理中应用的基础,因此学习好词向量是学习深度学习技术在自然语言处理用应用的重要环节。
资源目录:
第1章One hot编码(48分钟5节) 1-1课程整体介绍及大纲剖析[10:24] 1-2什么是one-hot编码[05:03] 1-3one-hot在提取文本特征上的应用[04:45] 1-4one-hot编码手动实现[18:59] 1-5ont-hot编码keras中实现[09:33] 第2章word2vec预备基础知识及相关概念(1小时13分钟9节) 2-1word2vec的前世今生[07:28] 2-2word2vec需要注意的关键点[08:23] 2-3sigmoid与softmax函数讲解[04:32] 2-4二叉树相关知识讲解[06:38] 2-5Huffman树讲解[11:07] 2-6Huffman编码讲解[07:46] 2-7语言模型讲解[11:30] 2-8神经网络语言模型概念讲解[06:40] 2-9神经网络语言模型数学理论部分讲解[09:09] 第3章word2vec实现及优化方式(50分钟4节) 3-1word2vec中Skip-Gram实现方式讲解[13:30] 3-2word2vec中CBOW实现方式讲解[11:15] 3-3word2vec训练方式负采样讲解[13:10] 3-4word2vec训练方式层序softmax讲解[12:57] 第4章word2vec之Tensorflow实现(2小时37分钟9节) 4-1读取停用词[10:36] 4-2文本预处理上[15:51] 4-3文本预处理下[12:41] 4-4文本编码处理讲解[18:30] 4-5批量数据生成讲解[25:01] 4-6遗留问题解决讲解[07:02] 4-7word2vec模型实现讲解[24:35] 4-8word2vec模型训练讲解[23:37] 4-9word2vec可视化展示[19:32] 第5章 word2vec之gensim工具包使用 (1小时 6节) 5-1gensim中word2vec参数讲解[08:26] 5-2gensim-word2vec实战之加载停用词[06:06] 5-3gensim-word2vec实战之文本预处理[15:10] 5-4gensim-word2vec实战之模型训练[09:46] 5-5gensim-word2vec实战之模型保存与加载[07:48] 5-6gensim-word2vec实战之应用讲解[13:31] 第6章 fasttext理论部分 (22分钟 2节) 6-1fasttext之Subword n-gram讲解[10:47] 6-2fasttext之分层softmax讲解[11:55] 第7章 fasttext之文本分类实战及词向量训练 (53分钟 5节) 7-1fasttext实战之数据集简介及停用词加载[06:37] 7-2fasttext实战之文本预处理[14:24] 7-3fasttext实战之文本分类模型训练[09:34] 7-4fasttext实战之模型使用讲解[12:59] 7-5fasttext实战之训练词向量[09:34] 第8章 Glove理论部分 (46分钟 5节) 8-1什么是Glove讲解[07:12] 8-2Glove如何实现讲解[09:20] 8-3Glove如何训练讲解[12:30] 8-4Glove数学原理讲解上[10:01] 8-5Glove数学原理讲解下[07:51] 第9章 Glove实战部分 (29分钟 3节) 9-1Glove实战是初识Glove[13:19] 9-2Glove实战之求近义词[07:07] 9-3Glove实战之求类比词[08:40] 第10章 综合案例-短文本标题相似度检测及计算 (2小时42分钟 14节) 10-1项目实战之项目简介及数据集介绍[05:23] 10-2项目实战之GrobalParament模块编写[10:40] 10-3项目实战之utils模块中读取停用词方法编写[09:58] 10-4项目实战之utils模块中分词方法封装[09:12] 10-5项目实战之utils模块中文本预处理方法编写[14:39] 10-6项目实战之utils模块中文本预处理优化[11:41] 10-7项目实战之train_model模块之word2ve[09:28] 10-8项目实战之训练好的word2vec模型剖析[10:26] 10-9项目实战之word2vec整体训练[10:00] 10-10项目实战之相似度计算上[10:59] 10-11项目实战之相似度计算中[18:13] 10-12项目实战之相似度计算下[13:02] 10-13项目实战之结果输出[18:54] 10-14项目实战整体总结[10:17]