一、培训简述
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握NLP基础
2.关键词提取与文本分类方法
3.文本向量化与句法分析方法
4.NLP与深度学习技术的相应算法
5.掌握图像识别技术
二、培训特色
本次培训从实战的角度对自然语言处理(NLP)进行了全面的剖析,并结合实际案例分析和探讨NLP的应用场景,给NLP相关从业人员以指导和启迪。
三、培训时长
共计3天,每天6课时
四、培训大纲
	
	| 单元 | 培训模块 | 培训内容 | 
	
	| 第一单元 | NLP入门与基础介绍(一) | 
	NLP的基本概念NLP的发展历程NLP主要研究方向 
	句法语义分析信息抽取文本挖掘机器翻译信息检索问答系统对话系统 | 
	
	| 第二单元 | NLP入门与基础介绍(二) | 
	NLP的基础
	
	分词
	
	正向最大匹配算法逆向最大匹配算法双向最大匹配算法基于N-gram语言模型的分词基于HMM的分词方法基于CRF的分词法法文本基本处理
	
	词性标注
	
	基于最大熵的词性标注基于统计最大概率输出词性基于HMM词性标注基于CRF的词性标注命名实体识别
	
	案例
	
	在线中文分词系统实战命名实体识别接口开发基于词性标注的关键词提取 | 
	
	| 第三单元 | 关键词提取与文本分类(一) | 
	关键词提取概述关键词提取算法 
	TF-IDFLSA/LSI算法PLSA算法LDA算法 | 
	
	| 第四单元 | 关键词提取与文本分类(二) | 
	文本分类算法 
	朴素贝叶斯线性分类器支持向量机Bagging模型Boosting模型浅层神经网络 
	案例
	
	新闻主题提取新闻分类实战 | 
	
	| 第五单元 | 文本向量化与句法分析(一) | 
	文本向量化概述文本向量化常用算法
	
	词袋算法HashTF算法Word2Vec算法Glove算法 | 
	
	| 第六单元 | 文本向量化与句法分析(二) | 
	句法分析概述句法分析常用算法
	
	PCFG算法条件随机场算法案例
	
	文本情感分析的开发示例基于依存句法分词的问句相似度计算 | 
	
	| 第七单元 | 图像识别项目 | 
	介绍Google图像识别模型Inception-v3使用Inception-v3做图像识别 | 
	
	| 第八单元 | 猫狗分类项目 | 1.图像数据预处理 2.猫狗分类-简单CNN
 3.猫狗分类-VGG16-bottleneck
 4.猫狗分类-VGG16-Finetune
 | 
	
	| 第九单元 | 验证码识别项目 | 1.多任务学习介绍 2.验证码识别项目
 | 
	
	| 第十单元 | 目标检测项目 | 1.目标检测任务介绍 2.RCNN/Fast-RCNN/Faster-RCNN算法介绍
 3.YOLO算法介绍
 4.SSD算法介绍
 5.目标检测项目实战
 | 
	
	| 第十一单元 | 目标分割项目 | 1.目标分割任务介绍 2.全卷积网络
 3.双线性上采样
 4.特征金字塔
 5.Mask RCNN算法介绍
 6.目标分割项目实战
 | 
	
	| 第十二单元 | 图像风格迁移项目 | 1.图像风格迁移介绍 2.图像风格迁移项目实战
 | 
	
	| 第十三单元 | GAN项目 | 1.生成式对抗网络GAN介绍 2.生成式对抗网络GAN项目实战
 | 
	
	| 总结与考核 | 
 
(注:大纲还可根据需求进行调整)
 
第二部分  师资简介
覃棅丰
创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利,同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
 
人工智能相关工作经历:
上海希格斯网络科技有限公司  数据挖掘工程师   
1.负责深度学习NLP算法的研究和实现。
2.负责搜索引擎的实现和优化。
 
上海索洛信息技术有限公司     高级算法工程师   
1.负责深度学习图像算法的研究和实现。
2.负责深度学习语音算法的研究和实现。
 
人工智能相关项目经验:
人岗匹配项目 负责算法实现   
● 收集了10万份JD。
● 基于Tensorflow平台使用LSTM+Attention算法。
● 使用JD训练职位推荐模型。训练好的模型可用于分析简历描述,并根据简历描述推荐一个或多个适合的职位。
 
项目关键词提取项目  负责算法实现   
● 收集了10万份项目描述,并标记好项目中的关键词。
● 基于Tensorflow平台使用seq2seq模型。
● 从简历的项目描述中提取出该项目中的重点词汇。可用于优化简历项目搜索结果。
 
人才搜索引擎项目  负责搜索引擎的实现和优化
● 搭建简历搜索引擎服务。
● 完成学校名,专业,公司,行业等模块的搜索策略
● 完成搜索结果高亮服务。
● 修改搜索bug优化搜索算法。
 
宠物脸识别项目  负责数据处理,算法实现    
● 收集了5万张狗/猫的照片,并标记好它们脸部的区域。
● 在Linux下基于Caffe平台使用Faster-rcnn实现狗/猫脸检测算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的脸,并把狗/猫的脸框出来,给它们的长相打一上个分数,再把处理后的照片反馈给用户。 
 
宠物品种识别项目 负责数据处理,算法实现  
● 收集了19种猫和27种狗的照片,共3万多张,并做好分类标签。
● 基于Caffe平台使用AlexNet,GoogleNet以及自己设计的网络实现宠物品种分类算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的品种,不同宠物的品种会对应不同明星的脸,再把与宠物品种相似的明星脸反馈给用户。 
 
宠物叫声情感分类项目  负责数据处理,算法实现
● 收集了1万6千条狗叫声,分成8个类别。
● 基于Tensorflow平台使用CNN,LSTM实现狗叫声情感分类算法。
● 将训练好的模型放到嵌入式设备中,实时判断当前场景是否有狗叫声,有狗叫声的话是属于什么分类。