启发式规则 heuristic rule 在人工智能的问题求解时,为了减少搜索而使用的经验性知识等信息或规则。这些规则有助于使搜索过程向最有利于达到目标的方向进行。    
树结构 tree structure 用树形式组织信息的方法。    
条件概率 conditional probability 在概率统计中,条件A在事件B发生的情况下发生的概率,称为条件概率,记作P(A|B)。    
训练集 training aet 用来设计或测试的样本集合。    
知识库 knowledge base 为了满足求解问题的需要,按照一定的知识表示方式在计算机系统中组织、存储和使用的互相联系的知识集合。    
形式文法 formal grammar 形式化语法规则的集合。这些规则是采用特殊符号写成的。用尖括号<>将语法成分的名字括起来;随后用::=表示"其范例是";接着是其具体范例的表达式或符号。如果有多个范例,则在两个范例之间用符号"|"分隔开来。    
汉字输入 Chinese character input 根据汉字的形、音等信息,通过各种方式,把汉字转换成计算机内部的数字形式的过程。    
定向匹配 directed matching 语音理解系统的字假设器所采用的一种匹配方法,字假设器的目标是为每个未知语音部分找到一个包括正确字在内的最小语音相似空间。至少有三种方法可以用来寻找该最小空间。它们是迭代匹配假设,定向匹配假设和按数据匹配假设。    
语言知识库 Language knowledge base 在计算机内存储的语言知识的集合。它是计算机从语音、文字、词汇、句法、语义、语用等角度对语言进行信息处理的基础。    
语言模型 language model 语言客观事实的形式化模拟。语言模型是语言客观事物的近似物,语言模型与语言客观事物之间的关系,与数学上的抽象直线与客观世界中存在的各种各样的直线之间的关系类似。    
概念树 concept tree 知识组织的一种表达形式。树中每一节点表示基本概念,节点间的联线表示基本概念间的相互关系,前一节点代表的概念为后一节点所代表概念的先决条件。    
汉字输出 Chinese character output 将计算机内部以数字形式表示的汉字用计算机外部设备(例如显示终端、打印机等)输出的过程。    
汉字内部码 Chinese character internal code 汉字在信息处理系统内部最基本的表达形式,供存储、处理、传输汉字用。它与汉字交换码有一定的对应关系,通常借助于某种特定标识信息来表明它与单字节字符的区别。    
汉字交换码 Chinese character code for information interchange 汉字信息处理系统之间或者信息处理系统之间进行汉字信息交换的代码。    
语音输入 speech input 通过下述过程所实现的数据输入:通过人机接口接受并识别一种特定的语音信号,然后将其转换为一种代码,传送给计算机。计算机接收这种数据,如同键入的一样。    
机器翻译 machine translation 用计算机将一种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。包括书面语机器翻译和语音机器翻译。 自动翻译  
机器翻译系统 machine translation system 实现机器翻译的计算机应用程序。有基于规则的机器翻译系统,通常包含机器词典、规则库、源语分析器、目标语生成器及翻译支援程序等部分。也有基于统计语言模型的机器翻译系统。 自动翻译系统  
源语言 source language 从一种语言转换为另一种语言时,原来的语言称为源语言。对机器翻译系统来说,源语言是输入的语言。    
目标语言 target language 从一种语言转换为另一种语言时,新的语言称为目标语言。对于机器翻译系统来说,目标语言是输出的语言。    
语言对 language pair 机器翻译中参与翻译的一种源语言和一种目标语言的合称。    
受限语言 restricted language 在词汇、句法、语义及语用等方面受到人为限制的自然语言的真子集。    
转换法 transfer approach 经过源语分析、源语到目标语的转换和目标语生成三个阶段来实现机器翻译的策略和方法。    
中间语言法 interlingua approach 一种实现机器翻译的策略和方法。利用独立于任何特定自然语言的某种中介表达式来统摄翻译所需的句法和语义信息,表示源语和目标语之间的联系。 中介语言法  
语法标注 grammatical tagging 给自然语言文本中的语言单位按形式、功能或意义标明语法类别的过程。    
机器词典 machine dictionary 以供人使用的词典为基础,对词条的语音、词法、句法、语义、用法等信息进行规范化或形式化描述,存储在计算机里的词典。可为各种用途的自然语言处理系统提供语言知识资源。    
人用电子词典 human-oriented ED 存储在磁盘、光盘或集成电路等媒体上供人使用的词典。    
机器可读词典 machine-readable dictionary 存储在磁盘、光盘或集成电路等媒体上的词典,可以在计算机上读取。    
频率词典 frequencydictionary 按指定语言单位在使用中出现的频次或分布情况统计编纂的词典。    
用户词典 user specific dictionary 自然语言信息处理应用系统中为特定用户设计的、便于该用户使用和维护的机器词典。    
双语词典 bilingual dictionary 词目和释义分别用两种语言表达的词典。    
单语词典 monolingual dictionary 词目和释义用同一种语言表达的词典。    
自然语言生成 natural language generation 在研究自然语言的机制和实现过程的基础上,用计算机把想说的意思以口语或书面语的形式表达出来。    
可扩展置标语言 ①extensible markup language ②XML 标准通用置标语言(SGML)的子集。用来定义电子文件的类型,制作和管理用SGML定义的文件,以便在网上传输和共享这些文件。 可扩展标记语言