自然语言(英语:Natural language)通常是指一种自然地随文化演化的语言。英语、汉语、法语、西班牙语、日语为自然语言的例子,而世界语则为人工语言,即是一种由人特意为某些特定目的而创造的语言。

自然语言处理,英文为natural language processing,简称NLP,是人工智能语言学领域的分支学科.
自然语言认知则是指让电脑“懂”人类的语言
– 1950 图灵测试
– 1954 自动翻译超过60句俄文为英文,研究人员生成三到五年可以解决机器翻译的问题,有种大跃进的味道。
– 1960 发展特别成功的NLP系统包括SHRDLU
– 1964-1966 约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA——几乎未运用人类思想和感情的讯息,有时候却能呈现令人讶异地类似人之间的互动。“病人”提出的问题超出ELIZA 极小的知识范围之时,可能会得到空泛的回答。例如问题是“我的头痛”,回答是“为什么说你头痛?”
– 1970 概念本体论 实例有MARGIE、SAM、PAM、TaleSpin、QUALM、Politics以及Plot Unit。许多聊天机器人在这一时期写成,包括PARRY 、Racter 以及Jabberwacky
– 1980 多数自然语言处理系统是以一套复杂、人工订定的规则为基础
– 1980年代末期 语言处理引进了机器学习的算法,NLP产生革新。成因有两个:运算能力稳定增加(参见摩尔定律);以及乔姆斯基 语言学理论渐渐丧失主导(例如转换-生成文法)。该理论的架构不倾向于语料库——机器学习处理语言所用方法的基础。有些最早期使用的机器学习算法,例如决策树,是硬性的、“如果-则”规则组成的系统,类似当时既有的人工订定的规则。不过词性标记将隐马尔可夫模型引入NLP,并且研究日益聚焦于软性的、以机率做决定的统计模型,基础是将输入资料里每一个特性赋予代表其分量的数值。许多语音识别现今依赖的快取语言模型即是一种统计模型的例子。这种模型通常足以处理非预期的输入数据,尤其是输入有错误(真实世界的数据总免不了),并且在整合到包含多个子任务的较大系统时,结果比较可靠。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注