2025-04-212025-04-21 随手记 1 分钟读完 (大约117个字) 0次访问

什么是大模型外推性？

外推性 #card

是指大模型在训练时和预测时的输入长度不一致，导致模型的泛化能力下降的问题。
例如，如果一个模型在训练时只使用了512个 token 的文本，那么在预测时如果输入超过512个 token，模型可能无法正确处理。
这就限制了大模型在处理长文本或多轮对话等任务时的效果。

什么是大模型外推性？

https://blog.xiang578.com/post/logseq/什么是大模型外推性？.html

作者

Ryen Xiang

发布于

2025-04-21

更新于

2025-04-21

许可协议

网络回响

评论