GB∕T 41867-2022 信息技术 人工智能 术语.pdf
《GB∕T 41867-2022 信息技术 人工智能 术语.pdf》由会员分享,可在线阅读,更多相关《GB∕T 41867-2022 信息技术 人工智能 术语.pdf(18页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、ICS 35.020CCS L 70中华人民共和国国家标准GB/T 418672022信息技术人工智能术语Information technology-Artificial intelligence-Terminology2022-10-12 发布2023-05-01 实施国家市场监督管理总局 国家标准化管理委员会GB/T 418672022目 次前言.11 范围.12规范性引用文件.13 术语和定义.13.1 基础术语.13.2 关键通用技术相关术语.23.3 关键领域技术相关术语.63.4 安全/伦理相关术语.7参考文献.9索引.10GB/T 418672022前言本文件按照GB/T 1.
2、12020标准化工作导贝IJ第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国信息技术标准化技术委员会(SAC/TC 28)提出并归口。本文件起草单位:中国电子技术标准化研究院、华为技术有限公司、山东省计算中心(国家超级计算济南中心)、中电长城网际系统应用有限公司、中国医学科学院生物医学工程研究所、北京电信规划设计 院有限公司、浪潮软件科技有限公司、上海依图网络科技有限公司、北京旷视科技有限公司、江苏诺安科技有限公司、北京百度网讯科技有限公司、北京眼神科技有限公司、沈阳新松机器人自动化股份有限公司、杭州海康威视
3、数字技术股份有限公司、曙光信息产业股份有限公司、清华大学、北京智谱华章科技有限公司、国际商业机器(中国)有限公司、北京海天瑞声科技股份有限公司、北京电子工程总体研究所、中国人民解放军国防科技大学、杭州中奥科技有限公司、西北工业大学、上海商汤智能科技有限公司、上海仪电(集团)有限公司、小米通讯技术有限公司、中国科学院软件研究所、中科极限元(杭州)智能科技股 份有限公司、中国科学院自动化研究所、徐州医科大学、浙江省杭州市余杭区数据资源管理局、中国航空 综合技术研究所、行为科技(北京)有限公司、深圳云天励飞技术股份有限公司、海尔优家智能科技(北 京)有限公司、中国食品药品检定研究院、磅客策(上海)智
4、能医疗科技有限公司、上海人工智能研究院有 限公司、上海木木机器人技术有限公司、云从科技集团股份有限公司、北京小马智行科技有限公司、泾丰 科技(深圳)有限公司、南京大学、上海智能制造系统创新中心有限公司、上海智能制造功能平台有限公 司、中国信息通信研究院、金税信息技术服务股份有限公司、苏州中德宏泰电子科技股份有限公司、英飞 智信(北京)科技有限公司、杭州方得智能科技有限公司。本文件主要起草人:鲍薇、董建、吴国纲、曹晓琦、杨磊、徐洋、尤昉、钱恒、高永超、闵京华、马万钟、蒲江波、冯霄鹏、韩霄、李婷、王功明、赵春吴、杜云鹏、张健、吴月升、杨春林、张锋、任文奇、张栋栋、唐杰、左家平、程海旭、郝玉峰、许程
5、、杨绍武、史殿习、郑申俊、陆韵、孙云、杨冈八姚远、孙宁、马珊珊、汪小娟、马骋吴、张琦、蒋慧、吴庚、章建兵、赵群、孟令中、温正棋、陶建华、刘斌、吴响、泮科伟、王炜、刘新建、宋文林、贾一君、李斌斌、孟思宏、胡文泽、王先庆、郝炜、张兆东、沈激、梁恒康、李军、郝峥蛛、任军民、耿金菊、王飞、谭李诺、刘硕、秦爱民、李磊、罗陨飞、彭黔平。TGB/T 4186720221范gi信息技术人工智能术语本文件界定了信息技术人工智能领域中的常用术语及定义。本文件适用于人工智能领域概念的理解和信息交流,以及科研、教学和应用。2规范性引用文件本文件没有规范性引用文件。3术语和定义3.1 基础术语3.1.1分布式人工智能
6、distributed artificial intelligence人工智能系统实现的一种方式.其中数据与指令在一组以特定拓扑结构相互连接的节点之间传递 和处理,以完成人工智能任务。注:节点连接拓扑一般包含去中心化结构、星形结构、环形结构、树形结构等。3.1.2人工智能 artificial intelligence;AI学科.人工智能系统(3.L8)相关机制和应用的研究和开发。3.1.3人工智能服务器 artificial intelligence server信息系统中能够为人工智能应用提供高效能计算处理能力的服务器。注1:以通用服务器为基础,配备人工智能加速后,为人工智能应用提供专用计
7、算加速能力的服务器,称人工智 能兼容服务器。注2:专为人工智能加速计算设计,提供人工智能专用计算能力的服务器,称人工智能一体机服务器。3.1.4人工智能集群 artificial intelligence cluster遵循统一控制的,人工智能计算功能单元的集合。注1:人工智能计算功能单元可包含人工智能加速处理器、人工智能服务器、人工智能加速模组等。注2:当由人工智能服务器组成时,人工智能集群可称为人工智能服务器集群,其中的人工智能服务器可称为 节点。3.1.5人工智能加速处理器 artificial intelligence accelerating processor人工智能加速芯片 ar
8、tificial intelligence accelerating chip具备适配人工智能算法的运算微架构,能够完成人工智能应用运算处理的集成电路元件。1GB/T 4186720223.1.6人工智能加速模组 artificial intelligence accelerating module专为固定领域人工智能计算设计,部署在边缘计算场景中的扩展加速部件。注:人工智能加速模组一般用于执行智能摄像机、机器人、无人机等设备的人工智能计算任务。3.1.7人工智能设施包 artificial intelligence portfolio一-种组成人工智能应用解决方案,帮助用户实现不同规模的业务
9、逻辑的软硬件包。注:典型的人工智能设施包包括人工智能加速处理器、云计算资源池、加速处理器算子库等。3.1.8人工智能系统 artificial intelligence system针对人类定义的给定目标,产生诸如内容、预测、推荐或决策等输出的一类工程系统。注1:该工程系统使用人工智能(3.1.2)相关的多种技术和方法.开发表征数据、知识、过程等的模型,用于执行 任务。注2:人工智能系统具备不同的自动化级别。3.1.9异构资源池 heterogeneous resource pool一种将不同架构、不同实现方式的人工智能计算资源组织起来,自动按需满足不同计算需求的统一 调度软件集合。注1:异构
10、资源池提供一种可伸缩计算架构,有利于合理分配计算资源,为不同运行环境(例如云、集群、移动设备、物联网)的人工智能应用系统的开发和部署提供计算能力、存储、带宽和延时保障。注2:人工智能计算资源包括中央处理单元(CPU)、图形处理单元(GPU)、神经网络处理单元(NPU)、现场可编程 逻辑门阵列(FPGA)、数字信号处理器(DSP)、专用集成电路(ASIC)等。3.2关键通用技术相关术语3.2.1贝叶斯网络 Bayesian network一种使用贝叶斯推理进行概率计算并表示为有向无环图的概率模型。3.2.2半监督机器学习 semi-supervised machine learning在训练过程
11、中,能够同时使用标注数据和无标注数据进行训练的一种机器学习任务。3.2.3测试数据test data评价数据 evaluation data用于评估最终机器学习模型性能的数据 飞注:测试数据与训练数据、验证数据无交集。3.2.4长短时记忆网络 long short-term memory network;LSI M network一种含有区块结构并能够对不定时间长度的数值形成记忆,决定输入的记忆及输出的循环神经 网络。注:K短时记忆网络对处理长、短程相关性序列数据均具备良好性能。3.2.5迭代 iteration针对一批样本,重复地执行系列步骤直至完成训练的过程。2GB/T 418672022
12、注:一个(训)期中的迭代数量等于该期中,训练样本的批数,来源 JSO/IEC 2382:2015,2121826,有修改3.2.6分类模型 classification model机器学习一种对给定输入数据,输出其所属的一个或多个类别的机器学习模型。3.2.7过拟合 overfitting机器学习创建的模型过于精确地拟合训练数据,对新数据缺乏泛化性。注1:过拟合可能由以下原因造成:训练的模型从训练数据中学习了非必要的特征(例如,对有用输出无效的特 征),训练数据中过多的噪声(例如过多的离群点),训练数据与生产数据分布的品著不匹配,或模型复杂度 过高而与训练数据不匹配。注2:当在训练数据测量的误
13、差与在独立的测试及验证数据测量的误差之间存在显著差异时过拟合能被识别。当训练数据和生产数据之间存在严重不匹配时,过拟合模型的性能尤其会受到影响。3.2.8回归模型 regression model以给定数值为输入,预期的输出为连续变量的机器学习模型。3.2.9回归分析 regression analysis评价担责变量与预测变量关系模型的技术。来源:GB/T 3358.32009,3.3,有修改3.2.10机器学习 machine learning通过计算技术优化模型参数的过程,使模型的行为反映数据或经验。3.2.11机器学习模型 machine learning model-一种基于输入数据
14、或信息生成推理或预测的计算结构。示例:如果一个单变量线性方程(.),=%+/)经由线性回归训练,则结果模型为丁=3+7%。注:一个机器学习模型是基于机器学习算法训练的结果。3.2.12机器学习算法 machine learning algorithm依据给定的准则.根据数据确定机器学习模型参数的算法。示例:考虑求解一个单变量线性函数其中y是输出或结果是输入,痣是截距叫=0时y的值),仇 是权重。在机器学习中,确定线性函数的截距和权重的过程称为线性回归。3.2.13卷积神经网络 convolutional neural network;CNN深度卷积神经网络deep convolutional
15、neural network;DCNN一种前馈神经网络,在其至少一层中使用卷积。3.2.14连接权重 connection weight一个系数,在它与其他输入值结合前,乘以人工神经元的输入值。来源:GB/T 5271.342006,34.03.023.2.15联邦机器学习 federated machine learning一 种框架或系统能在不泄漏参与方所拥有的原始数据和隐私数据的同时,使多个参与方合作建立 3GB/T 418672022和使用机器学习模型且获得好的性能。3.2.16逻辑推理 logical inference利用符号、渭词、函数和量词等逻辑要素从给定的前提进行推理并得出结
16、论c3.2.17模式识别 pattern recognition通过功能单元对某一对象物理或抽象的模式以及结构和配置的辨识。来源:GB/T 5271.282001,28.01.1313.2.18模型训练 model training利用训练数据,基于机器学习算法,确定或改进机器学习模型参数的过程。3.2.19模型优化 model optimization提升模型执行速度,泛化能力,或改善利益相关方所关心的其他特性的方法。注:如神经网络模型优化的方式包含剪枝、量化、调整参数、调整模型深度和宽度、增减特征或根据硬件平台具体特 性重新安排聚合算子等。3.2.20批(量)训练 batch traini
17、ng一种训练方法,仅在一个(训)期后,才调整连接权重。来源 JSO/IEC 2382:2015,21206903.2.21偏置 bias基于参考值的系统性偏差。来源 JSO/IEC 2382:2015,21241033.2.22欠拟合 underfitting由于训练数据不足或不充分导致创建的模型在面向新数据时性能表现不佳或不准确。注:欠拟合可能会发生的情况:特征选择不当、训练时间不足,或者因模型能力有限(如表现力)使模型过于简单而 无法从大量训练数据中学习。3.2.23迁移学习 transfer lea门ing一种将旨在解决一个问题的模型应用到不同问题上的方法。3.2.24前馈神经网络 fe
18、ed forward neural network;FFNN一种神经网络,其中信息仅单向从输入层传送到输出层。3.2.25强化学习 reinforcement learning;RL一种通过与环境交互,学习最佳行动序列,使网报最大化的机器学习方法。3.2.26神经网络 neural network;neural net;artificial neural network由一层或多层神经元组成的网络,通过权值可调的加权连接,接收输入数据并产生输出。注1:神经网络是连接主义方法的一个突出例子。注2:虽然神经网络的设计最初是受生物神经元功能的启发,但大多数神经网络的研究不再遵循这种启发“4GB/T
19、4186720223.2.27深度学习 deep learning深度神经网络学习 deep neural network learning通过训练具有许多隐层的神经网络来创建丰富层次表示的方法。注:深度学习是机器学习的一个子集。3.2.28生成式对抗网络 generative adversarial network:GAN一种由单个或多个生成器网络和判别器网络组成的神经网络架构,两个神经网络用相互博弈的方 式进行学习。注:生成器依据真实样本创建具有代表性数据集的样本判别器用来区分生成的样本与真实样本。3.2.29数据标注 data labelling给数据样本指定目标变量和赋值的过程。3.2
20、.30推理 inference从给定的前提进行论证并得出结论。注1:在人工智能领域中,一个前提是一个事实、一个规则、一个模型、一个特征或原始数据。注2:术语“推理,既指过程也指结果。3.2.31微调 finetuning为提升人工智能模型的预测精确度,一种先以大型广泛领域数据集训练,再以小型专门领域数据集 继续训练的附加训练技术。注:常用于解决过拟合问题。3.2.32无监督机器学习 unsupervised machine learning仅用无标注数据实施训练的机器学习。3.2.33循环神经网络 recurrent neural network;RNN一种神经网络,其中前一层和前一处理步骤的
21、输出都被传送到当前层。3.2.34训练数据training data用于训练机器学习模型的输入数据样本子集。3.2.35验证数据 validation data开发数据 development data用于评估单个或多个候选机器学习模型性能的数据样本。注1:验证数据与测试数据是不重复的,通常也与训练数据不重复。但是在没有足够的数据进行三种方式的训 练、验证和测试集拆分的情况下,数据只被分成两个集-个测试集和一个训练或验证集。交叉验证或自助法是用于从训练或验证集中生成单独的训练和验证集的常用方法。注2:验证数据用于调优超参数或验证某些算法选择,直至在专家系统中包含给定规则的效果。3.2.36隐马
22、尔可夫模型 hidden Markov model:HMM一种如下信号模型:其中各信号段的状态都表示为马尔可夫过程的状态,且这些状态不能直接观5GB/T 418672022察到。注1:马尔可夫过程是由一系列状态组成的随机过程,其中从一个状态转移到另一状态的概率9只依赖于这两个状 态而与此前的各状态无关。注2:为识别某一讲话,由系统去计算在训练期间导出的各模型所生成的似然性。该讲话作为其模型给出最高似 然分值的词或其他实体识别出来。来源:GB/T 5271.292006.29.02.1113.2.37有监督机器学习 supervised machine learning仅用标注数据进行训练的机器
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GBT 41867-2022 信息技术 人工智能 术语 GB 41867 2022
限制150内