Instruction Following - 朱婉妤的知识库

# why - 为什么prompt engineering 对 llm 有效 # what - **Instruction Following**（指令遵循）是大语言模型（LLM）和人工智能系统的一项关键能力，指的是==模型能够理解并执行用户提供的自然语言指令。== - 后训练的微调：在当代大模型（如 ChatGPT、GPT-4、Claude、PaLM 等）的训练和**微调过程**中，提升其指令遵循能力是至关重要的目标。 # how - [[InstructGPT]] - OpenAI 的 **InstructGPT**是最早的研究之一，它通过 [[RLHF 基于人类反馈的强化学习]] （强化学习 + 人类反馈）优化，使 GPT-3 能更好地遵循指令。 # how good # Ref. - [chat with gpt-指令跟随](https://chatgpt.com/share/67986c8f-a930-8002-b6c5-ceaf2c6c8999)