作为人工智能和语言学领域的分支学科

什么是nlp

,简单来说,就是把自然语言(如英语或汉语普通话)转换成计算机能够用于理解这个世界的数据(数字)。同时,这种对世界的理解有时被用于生成能够体现这种理解的自然语言文本(即自然语言生成)。的英语是Natural Language Processing,缩写作 NLP。

自然语言处理

但你知道吗?NLP的英文缩写竟然也有“李鬼”和“李逵”之分?

NLP它也同样是神经语言编程这门伪科学的缩写,对于这两门学科,不熟悉的人往往会将二者混淆,今天我们就来扒一扒它们的真面目。

一位心理学家和语言学家创立的伪科学?

神经语言编程的英文是Neuro-Linguistic Programming,所以缩写也是“NLP”。

什么是nlp-NLP也分李逵和李鬼?关于自然语言处理你不知道的事插图

它由理查德·班德勒(Richard Bandler)和约翰·格林德(John Grinder)于1970年代在美国加利福尼亚创立。

理察·班德勒在求学时主修电脑学系,但他却醉心研究人类行为,遍读心理学丛书,常常向传统心理学派提出种种挑战,约翰·格林德是一名任教于加州大学的语言学家。这两人皆不满于传统心理学派的治疗过程,因其时间太长但治疗效果却不能持久。

在一次因缘际会下,他们一起研究并模仿当时几位在人类沟通以及心理治疗方面有卓越成就的大师(大师分别是催眠治疗大师及艾瑞克森催眠治疗学派创始人米尔顿·艾瑞克森 (Milton Hyland Erickson)、家庭治疗大师维珍尼亚·撒提亚 (Virginia Satir)以及完形治疗创始人弗烈兹·皮尔斯 (Fritz Pearls)),研究他们在治疗过程中运用的语言模式和心理策略

什么是nlp

,加上独创的理念最终整理出NLP的理论架构。

他们认为,神经过程(神经),语言(语言)和通过经验(编程)学习的行为模式之间存在联系,并且可以对其进行更改以实现生活中的特定目标,班德勒和格林德还声称,自然语言处理方法可以“建模”杰出人员的技能,从而使任何人都能获得这些技能。

虽然神经语言编程的起源似乎暗合了某些行为科学和心理学知识,听上去煞有介事,但是随着时间的推移,它在世人心中的观感却越来越差。

这是因为,并没有任何的科学证据可以支持NLP提倡者的主张,而且已经有不少科学评论指出,NLP基于关于大脑工作方式的过时隐喻,与当前的神经学理论不一致,并且包含许多事实错误,许多关于NLP的支持性研究都存在重大的方法学缺陷,这也成为它被众人认作是一门糊弄人的伪科学的原因。

同被称作NLP,自然语言处理缘起于图灵测试?

自然语言处理的英语全称是Natural Language Processing,缩写也是 NLP,它讨论的是如何处理及运用自然语言,简单理解就是是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。

自然语言处理的起源是从1950年开始,那一年,艾伦·图灵(Alan Turing)写了一篇论文,描述了对“思考型”机器的测试。他说,如果一台机器可以通过使用电传打字机成为对话的一部分,并且它完全模仿了人类,没有明显的差异,那么该机器就可以被认为具有思维能力。

此后不久,在1952年,霍奇金-赫克斯利模型展示了大脑如何利用神经元形成网络。这些事件激发了人工智能(AI)的思想,自然语言处理 (NLP),以及计算机的发展。

1960年代发展特别成功的NLP系统有两个,一个是SHRDLU—— 一套词汇设限、运作也受限如“积木世界”的一种自然语言系统;另外一个是1964-1966年约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA,它有时候却能呈现令人讶异地类似人之间的交互。但仅限于在ELIZA 极小的知识范围之内,否则,就只能得到空泛的回答。

一直到1980年代,多数自然语言处理系统仍是以一套复杂、人工订定的规则为基础。不过从1980年代末期开始,语言处理引进了的算法,NLP产生革新,开始了蓬勃发展。

机器学习

自然语言处理是如何崛起的?

1980年代后期,NLP发生了一场革命,此时某些早期的机器学习算法(决策树提供了一个很好的例子)产生了类似于旧式手写规则的系统,但研究越来越集中在统计模型上,这些统计模型能够做出软概率决策。

1997年,LSTM递归神经网络(RNN)模型被引入,并在2007年找到了语音和文本处理的市场。彼时,神经网络模型被认为是NLP对文本和语音生成的理解中研究和开发的前沿。

2001年,Yoshio Bengio和他的团队提出了第一个神经“语言”模型—— 前馈神经网络。它描述了一种不使用连接来形成循环的人工神经网络,在这种类型的网络中,数据仅在一个方向上移动,从输入节点到任何隐藏节点,再到输出节点。

什么是nlp-NLP也分李逵和李鬼?关于自然语言处理你不知道的事插图1

在2011年,Apple的 Siri成为世界上第一个成功被普通消费者使用的NLP / AI助手之一。在Siri中,自动语音识别模块会将所有者的单词转换为数字解释的概念,然后,语音命令系统会将这些概念与预定义的命令进行匹配,从而启动特定的操作。例如,如果Siri问:“您想听一下您的余额吗?” 它会理解“是”或“否”的响应,并采取相应的措施。

近年来,由于大数据的可用性,强大的计算能力和增强的算法,自然语言处理更是迅速发展和转变,已被广泛应用于各个行业:

▪ NLP在翻译行业中被广泛使用。许多本地化公司使用机器翻译来帮助其翻译人员更有效地工作。当文本已经大部分由机器翻译时,可以为他们节省宝贵的时间,并且每天可以翻译的单词数量增加。

▪ 搜索引擎使用自然语言处理来根据相似的搜索行为或用户意图得出相关的搜索结果。通过使用NLP,普通人可以找到他们想要的东西。

▪ NLP也用于电子邮件过滤器。Gmail的电子邮件分类是较新的NLP应用程序之一。根据收到的电子邮件的内容,Gmail还可以识别电子邮件属于三个类别(主要,社交或促销)中的哪一个。这可以帮助用户确定哪些电子邮件很重要并且需要快速响应,以及他们可能希望删除的电子邮件。