- Objective: - Breadcrumb: # 概念阐释 语言能力的基础是语言知识和世界知识,而不是语法规则。 我们在学习语言的过程可以借鉴机器学习语言的历史经验。学习语言并不能靠背单词和记住语法规则就指望能生成语言了。而是要大量听读语言材料,在真实的知识场景、生活场景中积累大量的句子和短语。例如“I hit the bat against the wall”,按照语法规则的话,bat被翻译成蝙蝠也没问题,但按照世界知识,我们知道不可能抓着蝙蝠去砸墙,所以bat只能被翻译成棒子。 # 实例 按照语法规则,以下的句子都对,但是按照真实场景,有的句子不正确: - I broke the hammer against the glass. 错,在“break”这个词,内置的事件场景是“用一个工具砸”,必须twith) - The glass broke with the hammer.(错,如果有施动者,就必须有工具。) - I broke the glass with the harmer. (对) “break”有时有施动者,有时没有,但如果指出施动者,就必须有工具。永远是_hit_with. 而_break/broke_(with_.) "break"是可以自动破碎的,无施动者,无工具。“ - Sometimes last night, the rope cut.(错,”cut”“hit”这些动作内置了事件场景,其中必须有施动者) # 相关内容 机器学习语言,最初建立在语法规则和词汇输入,以为教会语法规则就能生成语言,但结果却是失败。70年代开始,人工智能的语言处理采用给机器装一套世界知识表征,用真实的语料来训练知识图谱,再基于这样的知识图谱训练自然语言的理解和产出,这就是chatGPT成功的原因。 # 参考资料