自然语言处理

自然语言（英语：Natural language）通常是指一种自然地随文化演化的语言。英语、汉语、法语、西班牙语、日语为自然语言的例子，而世界语则为人工语言，即是一种由人特意为某些特定目的而创造的语言。

自然语言处理，英文为natural language processing，简称NLP,是人工智能和语言学领域的分支学科.
自然语言认知则是指让电脑“懂”人类的语言
– 1950 图灵测试
– 1954 自动翻译超过60句俄文为英文，研究人员生成三到五年可以解决机器翻译的问题，有种大跃进的味道。
– 1960 发展特别成功的NLP系统包括SHRDLU
– 1964-1966 约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA——几乎未运用人类思想和感情的讯息，有时候却能呈现令人讶异地类似人之间的互动。“病人”提出的问题超出ELIZA 极小的知识范围之时，可能会得到空泛的回答。例如问题是“我的头痛”，回答是“为什么说你头痛？”
– 1970 概念本体论实例有MARGIE、SAM、PAM、TaleSpin、QUALM、Politics以及Plot Unit。许多聊天机器人在这一时期写成，包括PARRY 、Racter 以及Jabberwacky
– 1980 多数自然语言处理系统是以一套复杂、人工订定的规则为基础
– 1980年代末期语言处理引进了机器学习的算法，NLP产生革新。成因有两个：运算能力稳定增加（参见摩尔定律）；以及乔姆斯基语言学理论渐渐丧失主导（例如转换-生成文法）。该理论的架构不倾向于语料库——机器学习处理语言所用方法的基础。有些最早期使用的机器学习算法，例如决策树，是硬性的、“如果-则”规则组成的系统，类似当时既有的人工订定的规则。不过词性标记将隐马尔可夫模型引入NLP，并且研究日益聚焦于软性的、以机率做决定的统计模型，基础是将输入资料里每一个特性赋予代表其分量的数值。许多语音识别现今依赖的快取语言模型即是一种统计模型的例子。这种模型通常足以处理非预期的输入数据，尤其是输入有错误（真实世界的数据总免不了），并且在整合到包含多个子任务的较大系统时，结果比较可靠。

标签 MySQL

nirolee

自然语言处理

发表回复取消回复

发表回复 取消回复

发表回复取消回复