消息 message 具有各种内容和编码类型,并可以以存储转发方式传送的信息。    
数值数据 numerical data 数据(Data)是表达和传播信息的载体或工具。从实际使用的角度看,数据分为两类:"数值数据"和"非数值数据"。"数值数据"是指具有"量"的概念的数据,可比较大小,它常常带有量词。而"非数值数据"是指具有"陈述"意义的数据,它常常是对对象的一种"描述"或"表达"。    
检索系统 retrieval system 对结构化和非结构化数据包括多媒体信息进行储存、索引、查询和管理的系统。    
特征/标记系统 tag system 标记系统是一个规则集,它定义了固定数量的元素(它们要么是通常被定义过的,要么从一个序列开始处移去)以及一套附加元素集(它们是基于那些从开始处移去的元素)。    
同态 homomorphism 代数系统(G,*)和(S, °),f是从G到S上的一个映射. 对于任意a,b属于G,有f(a*b)=f(a) °f(b),则称f是由(G,*)到(S, °)的一个同态映射. 并称G与S同态。    
推导 derivation 生成语法术语,指一组形式上可识别的阶段,构成从起始符号到终端语符列的句子生成过程,即一整套已经应用的短语标记规则、转换规则等。    
推理规则 rule of inference 非终极符重写和替换的规则或者公式。    
无限制文法 unrestricted grammar 短语结构文法的规则在生成符号串的过程中没有附加任何限制,这种文法称为无限制文法。 0型文法、短语文法  
无限制语言 unrestricted language 应用无限制文法所定义的语言叫做无限制语言。    
无向树 undirected tree 连通无回路的无向图称为无向树,简称树    
无向图 undirected graph 若图G中的每条边都没有方向,则称为无向图。    
无序图 unordered graph 指图中结点之间没有次序排列,则称为无序图。    
相邻弧 adjacent arcs 同一回路中有且仅有一个公用节点的两个弧称为相邻弧。    
相邻项 adjacent vertices 由无向图G中一条边连接两个项,称为相邻项。    
映射 mapping 两个集合元素之间的一种对应规则。映射有时又称函数。    
有限图 finite graph 设G=(P, L)为图。如果P是点的非空集合,L是连接某些不同点对的边集合,并且任意一对不同点之间最多有一条边。当P为有限集时,G称为有限图。    
有序树 ordered tree 指树中同层结点从左到右有次序排列,它们之间的次序不能互换,这样的树称为有序树,否则称为无序树。    
有序图 ordered graph 指图中结点从左到右有次序排列,它们之间的次序不能互换,这样的图称为有序图。    
语法范畴 grammatical category 根据某些语法意义的共同内容,把语法意义概括为几个基本类别,这种语法意义的类就叫作语法范畴。语法范畴可以大致分为词法范畴和句法范畴两大类。    
语法规则 grammatical rule 是一种语言中由小的音义结合体组合成大的音义结合体所依据的一套规则。    
范畴 category 就是分类,是人的思维对客观事物的普遍本质的概括和反映。    
源程序 source program 由程序员应用各种程序语言编写的程序。这种程序一般需要编译成机器语言后才能在计算机上运行。    
源词 source word 机器翻译中被翻译的语言的词。    
真值语句 truth value expression 一个语句的值或者是真或者是假,则这个语句称为真值语句。    
正则集 regular set 设有字母表Σ,Σ上的正规表达式及其值称为正规集,其递归定义为:
(1)ε和Φ都是Σ上的正规表达式,它们所表示的正规集分别为{ε} 和Φ;
(2)任何a∈Σ,a是Σ上的一个正规式,它所表示的正规集为{a};
(3)假定U和V都是Σ上的正规式,它们所表示的正规集分别记为L(U)和L(V),那么,(U|V)、(U·V)和(U)*也都是正规式,它们所表示的正规集分别为L(U)∪L(V)、L(U)·L(V)(连接积)和(L(U)*(闭包)。
   
正则文法 regular grammar 是乔姆斯基短语结构文法分层里的3型文法。可用四元组G=(V,Σ,P,S)表示,其中V是变元的有限集合,Σ是终结符的有限集合,S∈V,称为开始符号,P是由形为A→w和A→wB(A→Bw)产生式组成的有限集。    
正则语言 regular language 由正则文法生成的语言。    
终极树 terminal tree 不能再解析的树。    
重言式 tautology 恒取真值的命题公式称为重言式。    
转换 transformation 从一种句法结构到另外一种句法结构的转变。    
转换规则 transformational rule 对句法结构进行转换的规则。    
转换语言 transformational language 由转换语法生成的语言。    
自反性 reflexivity 对所有a∈A,如果有(a,a)∈ R,则称R是A上的自反关系。    
自然语言 natural language 是与编程语言或者其他人机交互语言相对立而言的,用于人和人之间交流的书面语或者口语。    
family 数理语言学中,具有相同词干而词尾不同的一组词。一般表示为{ai},其中I I,I是一个非空集合,称为索引集,ai即表示族中索引为I的一个词。    
自然语言处理 natural language processing 用计算机对自然语言的音、形、义等语言文字信息进行的加工和操作,包括对字、词、短语、句、篇章的输入、输出、识别、转换、压缩、存储、检索、分析、理解和生成等各方面的处理技术。它是在语言文字学、计算机应用技术、人工智能、认知心理学和数学等相关学科的基础上形成的一门边缘学科。    
元理论 meta theory D.Hilbert采用分层理论的办法,把理论分为两层,一层是需要证明其相容性的那个系统,叫做对象理论;另一层是作为证明工具的那个系统,叫做元理论。元理论必须简单清晰,正确可靠,没有任何疑问。    
语言的随机模型 stochastic model of language 用概率统计的方法来揭示语言单位内在的统计规律的模型。常用的有N元语法以及马尔可夫模型等。    
语言归约 language reduction 自动机的读头自左向右扫描输入串,一边把输入符号移入栈内,一边检查位于栈顶部的一串符号是否与某产生式右部相同,如相同就把栈顶的符号替换成相应的产生式左部非终结符,这种替换称之为归约。    
自动索引 automatic indexing" 利用计算机自动从文章(或文本段落)中提取能代表主题的单词或短语的过程。    
自动分类 automatic classifying 利用计算机根据某种特征对元素进行划分和聚类的过程。