- # why - # what - [[LLM 大语言模型]]在训练完成后部署到服务器中供客户使用的阶段叫做推理阶段。 - 需要认识到的一件事是,即使是在推理阶段,ChatGPT每生成一个新的标记,都必须进行一次包括所有这些权重在内的计算。对于每个产生的标记,仍然需要进行1750亿次(1.8 万亿、18 万亿)的计算(并在最后进行一些额外的计算)—因此,不难理解使用ChatGPT生成一段长文本需要一些时间。 - # how - ![](https://image.harryrou.wiki/2025-03-12-CleanShot%202025-03-12%20at%2014.59.55%402x.png) - ![](https://image.harryrou.wiki/2024-10-13-CleanShot%202024-10-14%20at%2007.07.55.gif) - # how good - # Ref.