Python自然语言处理入门与实战-教学大纲 及 授课计划.docx
《Python自然语言处理入门与实战-教学大纲 及 授课计划.docx》由会员分享,可在线阅读,更多相关《Python自然语言处理入门与实战-教学大纲 及 授课计划.docx(12页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Python自然语言处理入门与实战教学大纲课程名称:Python自然语言处理入门与实战课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论34学时,实验30学时)总学分:4.0学分一、课程的性质自然语言处理作为人工智能的一个重要分支,促进了社会传播学的发展,并且在新闻传播 领域中的影响也越来越深刻。社会传播学是一门研究人类交流形式的学问,新闻包含于传播之 中,而语言交流和文字交流是人类最重要的交流方式。分析语言的成分和结构,理解语义和深 层意义,是社会传播学与自然语言处理的共同任务。自然语言处理与社会传播学的融合研究正 在成为新的趋势,中文自然语言处理能够迅速且有效地处理新媒
2、体特别是网络和社交媒体中 海量的内容与知识,能够有效加速社会传播学的研究进展。由于中文自然语言处理的研究起步 较晚,加上中文语句本身结构更为松散,语法和语义更为灵活,因此无法直接套用英文自然语 言处理中较成熟的理论和技术。与具有相对完善理论框架的社会传播学进行结合能够为中文 自然语言处理的发展带来新的机遇。为了推动我国大数据,云计算,人工智能和新闻传媒行业 的发展,满足日益增长的数据分析人才需求,特开设Python自然语言处理入门与实战。二、课程的任务通过本课程的学习,使学生学会使用Python进行数据爬取、分词与词性标注、命名实体 识别、关键词提取、文本向量化、文本相似度计算、文本分类与聚类
3、,并详细拆解学习情感分 类、文本分类和智能推荐三个实际案例,将理论与实践相结合,为将来从事数据分析挖掘研究、 工作奠定基础。Python自然语言处理入门与实战教学日历周次学时授课内容作业要求备注13第1章导论第1章课后习题25第2章文本数据爬取(1)第2章课后习题33第2章文本数据爬取(2)第3章文本基础处理(1)第3章课后习题45第3章文本基础处理(2)第3章课后习题53第3章文本基础处理(3)第3章课后习题65第3章文本基础处理(4)第4章文本进阶处理(1)第3章课后习题73第4章文本进阶处理(2)第4章课后习题85第4章文本进阶处理(3)第4章课后习题93第4章文本进阶处理(4)第5章
4、天问一号事件中的网民评论情感分析(1)第4章课后习题105第5章天问一号事件中的网民评论情感分析(2)第5章课后习题113第5章 天问一号事件中的网民评论情感分析(3)第6章新闻文本分类(1)第5章课后习题125第6章新闻文本分类(2)第6章课后习题133第6章新闻文本分类(3)第6章课后习题145第6章新闻文本分类(4)第7章 基于浏览记录的个性化新闻推荐(1)第7章课后习题153第7章基于浏览记录的个性化新闻推荐(2)第7章课后习题165第7章基于浏览记录的个性化新闻推荐(3)第8章 基于TipDM大数据挖掘建模平台实现新闻文本分类第7章课后习题打造数据智能职业敕育领军企业注:教材:戴程,
5、张良均.Python自然语言处理入门与实战M.北京:人民邮电出版社.2022.打造数据智能职业敕育领军企业三、课程学时分配序号教学内容理论学时实验学时其它1第1章导论212第2章文本数据爬取423第3章文本基础处理844第4章 文本进阶处理845第5章天问一号事件中的网民评论情感分析456第6章新闻文本分类467第7章 基于浏览记录的个性化新闻推荐468第8章基于TipDM大数据挖掘建模平台实现新闻文本分类02总计3430四、教学内容及学时安排1.理论教学序 号章节名称主要内容教学目标学时1导论1. 了解自然语言处理的概念2. 了解自然语言处理的发展历程3. 了解自然语言处理的主要内容4. 了
6、解自然语言处理的常用工具5. 了解Python数据分析的优势6,了解Python数据分析的常用类库7 .在Windows操作系统上安装Anaconda8 .创建自然语言处理虚拟环境1 . 了解自然语言处 理的概念、发展历程 与主要内容2 .了解自然语言处 理的常用库3 .掌握Windows系 统下Anaconda安装 4.掌握自然语言处 理虚拟环境的创建 方法22文本数据爬取1 .熟悉HTTP的常见请求方法2 .熟悉HTTP的与过程3 .熟悉常见的HTTP状态码4 .熟悉常见的HTTP头字段5 .熟悉HTTP的Cookie机制6 .爬取静态网页的数据7 . 了解静态网页和动态网页的区别8 .使
7、用逆向分析和Selenium库爬取 动态网页1 .熟悉HTTP请求 方法与过程2 .熟悉常见的 HTTP状态码、头字 段和Cookie3 ,掌握静态网页数 据的爬取方法4 . 了解静态网页和 动态网页的区别。5 .掌握逆向分析和 使用Selenium库爬 取动态网页的方法。43文本基础处理1 . 了解语料库的基本概念、用途、类 型2 .构建语料库3 .了解中文分词的基本概念和常用 方法4 .使用中文分词工具jieba库进行分 词5 .了解词性标注和命名实体识别的 基本概念6 .使用jieba进行词性标注7,使用jieba进行命名实体识别8 . 了解关键词提取的基本概念9 .提取文本中的关键词1
8、 ,了解语料库的基 本概念、用途、类型 和构建原则2 .了解中文分词的 基本概念和常用方 法3 .掌握中文分词工 具jieba库的使用方 法4 . 了解词性标注和 命名实体识别的基 本概念5 .熟悉jieba词性标 注的流程和命名实 体识别的实现流程6 . 了解关键词提取 的基本概念7 ,掌握关键词提取 的方法。81 . 了解文本向量化的基本概念。2 ,了解文本离散表示的常用方法3 .熟悉文本向量化模型Word2Vec和 Doc2Vec的基本原理4 .掌握Word2Vec和Doc2Vec模型的 训练流程和网络结构5 .计算文本的相似度6 . 了解文本挖掘的基本概念7 .熟悉常用的文本分类和聚类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python自然语言处理入门与实战-教学大纲 授课计划 Python 自然语言 处理 入门 实战 教学大纲 授课 计划
限制150内