# why - 为什么prompt engineering 对 llm 有效 # what - **Instruction Following**(指令遵循)是大语言模型(LLM)和人工智能系统的一项关键能力,指的是==模型能够理解并执行用户提供的自然语言指令。== - 后训练的微调:在当代大模型(如 ChatGPT、GPT-4、Claude、PaLM 等)的训练和**微调过程**中,提升其指令遵循能力是至关重要的目标。 # how - [[InstructGPT]] - OpenAI 的 **InstructGPT**是最早的研究之一,它通过 [[RLHF 基于人类反馈的强化学习]] (强化学习 + 人类反馈)优化,使 GPT-3 能更好地遵循指令。 # how good # Ref. - [chat with gpt-指令跟随](https://chatgpt.com/share/67986c8f-a930-8002-b6c5-ceaf2c6c8999)