自然语言处理怎么最快入门.docx
《自然语言处理怎么最快入门.docx》由会员分享,可在线阅读,更多相关《自然语言处理怎么最快入门.docx(7页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、自然语言处理怎么最快入门微软亚洲研究院链接s:/zhihu/question/19895141/answer/149475410来源知乎著作权归所有。商业转载请联络获得受权非商业转载请注明出处。自然语言处理简称NLP是研究计算机处理人类语言的一门技术包括1.句法语义分析对于给定的句子进展分词、词性标记、命名实体识别以及链接、句法分析、语义角色识别以及多义词消歧。2.信息抽取从给定文本中抽取重要的信息比方时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗讲来就是要解析谁在什么时候、什么原因、对谁、做了什么事、有什么结果。涉及到实体识别、时间抽取、因果关系抽取等关键技术。3.
2、文本挖掘或文本数据挖掘包括文本聚类、分类、信息抽取、摘要、情感分析和对挖掘的信息以及知识的可视化、交互式的表达界面。目前主流的技术都是基于统计机器学习的。4.机器翻译把输入的源语言文本通过自动翻译获得另外一种语言的文本。根据输入媒介不同可以细分为文本翻译、语音翻译、手语翻译、图形翻译等。机器翻译从最早的基于规那么的方法到二十年度前的基于统计的方法再到今天的基于神经网络编码-解码的方法逐渐形成了一套比拟严谨的方法体系。5.信息检索对大规模的文档进展索引。可简单对文档中的词汇赋之以不同的权重来建立索引可以利用123的技术来建立更加深层的索引。在查询的时候对输入的查询表达式比方一个检索词或一个句子进
3、展分析然后在索引里面查找匹配的候选文档再根据一个排序机制把候选文档排序最后输出排序得分最高的文档。6.问答系统对一个自然语言表达的问题由问答系统给出一个精准的答案。需要对自然语言查询语句进展某种程度的语义分析包括实体链接、关系识别形成逻辑表达式然后到知识库中查找可能的候选答案并通过一个排序机制找出最正确的答案。7.对话系统系统通过一系列的对话跟用户进展聊天、答复、完成某一项任务。涉及到用户意图理解、通用聊天引擎、问答引擎、对话管理等技术。此外为了表达上下文相关要具备多轮对话才能。同时为了表达个性化要开发用户画像和基于用户画像的个性化回复。随着深度学习在图像识别、语音识别领域的大放异彩人们对深度
4、学习在NLP的价值也寄予厚望。再加上AlphaGo的成功人工智能的研究以及应用变得炙手可热。自然语言处理作为人工智能领域的认知智能成为目前大众关注的焦点。很多研究生都在进入自然语言领域寄望将来在人工智能方向大展身手。但是大众常常遇到一些问题。俗话讲万事开始难。假如第一件事情成功了学生就能建立信心找到窍门今后越做越好。否那么可以能就灰心丧气甚至分开这个领域。这里针对给出我个人的建议祈望我的这些粗浅观点可以引起大众更深层次的讨论。建议1怎样在NLP领域快速学会第一个技能我的建议是找到一个开源工程比方机器翻译或深度学习的工程。理解开源工程的任务编译通过该工程发布的示范程序得到与工程示范程序一致的结果
5、。然后再深化理解开源工程示范程序的算法。自己编程实现一下这个示范程序的算法。再按照工程提供的标准测试集测试自己实现的程序。假如输出的结果与工程中出现的结果不一致就要仔细查验自己的程序反复修改直到结果与示范程序根本一致。假如还是不行就大胆给工程的写信请教。在此根底上再看看自己能否进一步完善算法或实现获得比示范程序更好的结果。建议2怎样选择第一个好题目工程型研究生选题很多都是教师给定的。需要采取比拟实用的方法扎扎实实地动手实现。可能不需要多少理论创新但是需要较强的实现才能以及综合创新才能。而学术型研究生需要获得一流的研究成果因此选题需要有一定的创新。我这里给出如下的几点建议。先找到自己喜欢的研究领
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 处理 怎么 最快 入门
限制150内