模式 pattern 用计算机或其他装置处理的物体、图象、语音、字符等信息形式。    
子模式 subpattern 模式的组成部分,用一些比较简单的子模式组成多级结构来描述一个复杂的模式。    
聚类中心 cluster centre 在聚类分析中的一个特殊样本,用来代表某一类,其他样本通过与它计算距离来决定是否属于该类。 群分析  
模糊聚类 fuzzy clustering 利用模糊集理论进行聚类分析的过程。根据研究对象本身的属性来构造模糊矩阵,在此基础上根据一定的隶属度来确定分类关系。    
模糊集 fuzzy set 一个集合,设X为全域,若A为X上取值[0,1]的一个函数,则A为模糊集。    
参量学习 parameter learning 机器学习的一种方法,指学习程序通过对事物的识别经验,对其判别函数的多项式系数进行修改,从而提高其识别率。这种学习的结果体现在参量的修改上,故称参量学习。    
先验概率 prior probability 根据训练集样本直接得出的概率,是后验概率的基础。    
简单聚类 simple clustering 一种聚类分析,把所有样本直接按属于或不属于某类进行聚类。    
特征向量 feature vector 在模式识别的特征空间中,每一个样本对应于一个向量,这个向量称作特征向量,特征向量具有若干个特征分量,表示被抽样物体的若干个特征。 特征矢量  
逻辑连词 logical connectives 复合命题中用来连接两个命题,表达某种逻辑关系的联结词。 逻辑联结词  
合取 conjunction 设P,Q为两命题,复合命题"P并且Q"称作P与Q的合取式,记作P∧Q,P与Q的合取表达的逻辑关系是P与Q两个命题同时成立。因而,自然语言中常用的联结词:和,不仅......而且......,虽然......但是......等,都可以符号化为∧。    
析取 disjunction 设P,Q为两命题,复合命题"P或Q"称作P与Q的析取式,记作P∨Q,自然语言中的"或"具有二义性,有时表示相容性"或",有时表示不相容性"或"。    
复杂特征 complex features 对一个语言单位具有的语音、语法、语义、语用等各种必要信息所进行的多重性质的描述。    
元语言 metalanguage 描述研究对象时使用的语言。可以是自然语言,也可以是人工语言。    
多义性 polysemy 一个词项具有多种不同的意义。 一词多义现象  
单义性 monosemy 一个词项只有一个意义。    
歧义 ambiguity 语言的不同层面上存在的一对多的现象。    
歧义排除 disambiguity 对语言不同层面上存在的一对多的现象,运用一定方法,选择其中一种最具可能的解释。 消歧、排歧  
同形异义词 homograph 书写形式相同而意义不同的词。    
语素变体 allomorph 同一语素在不同环境中的不同形式。 词素变体  
模式匹配 pattern matching 将输入模式与样本相匹配的过程。    
宽度优先策略 breadth-first strategy 在分析句子的过程中,每一个阶段都要先把处于同一平面上的所有节点可能具有的组合都产生出来,然后再做进一步归约的搜索方法。 广度优先策略  
深度优先策略 depth-first strategy 在分析句子的过程中,总是循着一条路径,做垂直扩展,一直走到底,不到终了不回头的搜索方法。    
语言工程 language engineering 开发、研制计算机识别、理解、生成人类语言系统的技术和领域。    
成分结构 constutuent structure 词汇功能语法术语。是词汇功能语法中句法描写的一个平面,指语言的外部结构,表示句子成分的先后次序,是由一组短语结构规则映射而形成的树型结构。    
功能结构 functional structure 词汇功能语法术语。是词汇功能语法中句法描写的一个平面,指语言的内部结构,表述各语言成分之间的关系,代表句子的语义。    
功能描述 functional description 词汇功能语法术语。是成分结构向功能结构转换的中介,由一组等式构成,具有形式化的特点,可以很容易地进行计算机编码。    
功能等式 functional equation 词汇功能语法术语。由它规定了单词所承载的语法信息的组合方法,在经过有穷步骤的运算之后,能够得到这些语法信息的最终组合结果——功能结构。    
句法树 syntactic tree 用短语结构语法分析句子时,从起始符开始,运用短语结构规则一步步推导出句子的符号序列,描述这个推导过程的树形图叫句法树。    
剖析树 parsing tree 描述计算机自动识别句子的各个句法单位以及它们之间相互关系的过程的树形图。    
层级理论 stratificational theory 动词谓语与角色在语义组合上存在的先后次序和谓语动词一致关系标记的语法化序列存在的先后次序,层次高的谓语动词的组合先于层次低的谓语动词的组合。    
带注释树 annotated tree 节点与节点之间的边上带有标记的树形图。    
自顶向下剖析 top-down parsing 根据重写规则,从初始符号开始,自顶向下地进行搜索,构造推导树,一直分析到句子的结尾位置。这样的方法叫做自顶向下剖析法。 自顶向下分析  
自底向上剖析 bottom-up parsing 从输入句子的句首开始顺次取词向前移进(shift)并根据文法的重写规则逐级向上归约(reduce),直到构造出表示句子结构的整个推导树为止。这样的方法叫做自底向上分析法。 自底向上分析  
翻译工作站 translator's workstation 运用机器辅助系统为经常进行翻译和外语写作的人员提供一个半自动工作环境,以帮助翻译者提高工作效率。    
翻译记忆 translation memory 通过自动记忆并使用先前人工翻译结果的方式来构建语言翻译知识系统的机器翻译方法。    
人助机译 human aided machine translation 通过人在译前、译后参与编辑的方法或以人机交互方式参与的方法来提高译文质量的机器翻译。    
确定性算法 deterministic algorithm 在分析过程中不需要进行回溯或并行,每一局部分析都将成为最终结果的分析方法。 等待观察析句法(Wait and See Parsing)  
非确定性算法 nondeterministic algorithm 在分析过程中面对多种可能时需要进行回溯或并行、并不是每一局部分析都将成为最终结果的分析方法。    
基于模式句法分析 pattern-based parsing 通过建立句子模型,进而采用模式匹配对句子结构进行分析的方法。    
试探性句法分析 heuristic parsing 以试探性规则或过程的知识作分析向导的一种并行分析。 启发式句法分析  
数据驱动句法分析 data-driven parser 从具体的数据出发,根据数据所提供的信息来控制操作流程的分析方法。    
活性线图句法分析 active chart parser 基于活性线图的、自底向上和自顶向下相结合的句法分析。    
词专家句法分析程序 word expert parser 根据单词之间的关系分析概念的一种自然语言理解的分析程序。在这样的程序中,语言学知识主要集中在单词本身,并把单词看作与解释过程(the process of interpretation)相关的语言学单位。    
通用句法处理程序 general syntactic processor 美国计算语言学家Kaplan于1973年提出的用于形式描写、分析和生成自然语言符号串的系统,其基本数据结构是线图。简称GSP。 通用句法处理器  
依尔利算法 Earley algorithm 美国计算语言学家Early于1970年提出的具有预测、扫描和完成三种功能的句法分析算法。    
CYK算法 Cocke-Younger-Kasami algorithm 基于非活性线图的、以乔姆斯基范式为描述对象的并行句法分析算法。CYK算法是Cocke-Younger-Kasami算法的缩写。    
LR算法 LR algorithm 由克努特(Knuth)于1965年提出的一种自底向上分析方法。根据分析栈的内容以及向前看k个输入串的符号决定分析动作的方法称为LR(k)算法。LR算法是k取不同值时的LR(k)算法的总称。