同样,语音转文字和机器翻译程序也并不理解它们所处理的语言,自动驾驶系统也不理解司机和行人用来避免事故的微妙眼神接触或肢体语言的含义 。
事实上,这些人工智能系统经常被提及的脆性(brittleness),即不可预测的错误和缺乏稳健的泛化能力,是评估AI理解力的关键指标 。
在过去的几年里,大型语言模型(LLMs)在人工智能领域的受众和影响力激增,也改变了一些人对机器理解语言前景的看法 。
大型预训练模型,也可以叫做基础模型(Foundation Models)是具有数十亿到上万亿个参数(权重)的深度神经网络,在海量自然语言语料库(包括网络文本、在线图书等)上进行「预训练」后得到 。
模型在训练期间的任务是预测输入句子中的缺失部分,所以这种 *** 也叫做「自监督学习」,由此产生的网络是一个复杂的统计模型,可以得到训练数据中的单词和短语之间是如何相互关联的 。
这种模型可以用来生成自然语言,并为特定的自然语言任务进行微调,或者进一步训练以更好地匹配「用户意图」,不过对于非专业人士和科学家来说,语言模型到底如何完成这些任务的,仍然是个谜 。
神经网络的内部运行原理在很大程度上是不透明的,即使是构建这些网络的研究人员对这种规模的系统的直觉也是有限的 。
【韩娱wvs什么意思 vs什么意思网络用语】神经科学家Terrence Sejnowski这样描述LLMs的涌现能力(emergence):
突破了某个阈值后,就好像外星人一下子出现了,可以用一种可怕的、人类交流的方式与我们交流 。目前只有一件事是清楚的,大型语言模型并非人类,它们行为的某些方面似乎是智能的,但如果不是人类的智能,它们的智能的本质是什么?
支持理解派VS反对理解派尽管大型语言模型展现出的性能让人震撼,但最先进的LLMs仍然容易受到脆性和非人类错误的影响 。
不过可以观察到,网络性能随着其参数数量和训练语料规模的扩大而有明显改善,这也使得该领域的一些研究者声称,只要有足够大的网络和训练数据集,语言模型(多模态版本)也许是多模式版本--将导致人类水平的智能和理解 。

文章插图
一个新的人工智能口号已经出现:唯一要做的就是提升模型规模(Scale is all you need)!
这种说法也体现了人工智能研究界关于大型语言模型的争论:
一派认为,语言模型能够真正理解语言,并能以通用的方式进行推理(尽管还没有达到人类的水平) 。
例如,谷歌的LaMDA系统在文本上进行了预训练,然后在对话任务上进行了微调,能够在非常广泛的领域内与用户进行对话 。
另一派认为,像GPT-3或LaMDA这样的大型预训练模型,无论它们的语言输出多么流畅,都不能拥有理解力,因为这些模型没有实践经验,也没有世界的心智模型 。
语言模型只是在预测大量文本 *** 中的单词方面的训练让它们学会了语言的形式,远远没有学会语言背后的意义 。
仅靠语言训练的系统永远不会接近人类的智慧,即使从现在起一直训练到宇宙消亡为止 。很明显,这些系统注定只能是浅层次的理解,永远无法接近我们在人类身上看到的全身心的思考 。

文章插图
另一位学者认为,在谈论这些系统时,智能、智能体以及推而广之的理解是错误的,语言模型实际上是人类知识的压缩库,更类似于图书馆或百科全书,而不是智能体 。
例如,人类知道「痒」让我们发笑是什么意思,因为我们有身体;语言模型可以使用「痒」这个词,但它显然没有过这种感觉,理解「痒」是将一个词映射到一种感觉上,而不是映射到另一个词 。
- 庄家洗盘的目的是什么?
- 主力什么位置会砸盘,洗盘?
- 什么是洗盘和出货?两者有什么区别?
- 新鲜山楂吃了有什么好处
- 股票中量大但是出现十字星能代表什么?
- 股票中的洗盘是什么意思?如何使用?
- 捞女、贴家庭主妇标签、没底线!为什么批评李靓蕾的全是女人?
- 吃桔子对身体有什么好处和坏处
- 在股票市场中,什么是主力洗盘,洗盘的作用是什么?
- 暴涨牛股拉升前洗盘常见手法有哪些?K线特征是什么?
