Large language model

[[Word Embedding]]

[[位置编码]]

[[Transformer]]

模型

  • [[GPT]]

  • [[LLaMA]]

  • [[QWen]]

  • [[GLM]]

  • [[Kimi]]

  • [[deepseek]]

  • [[MiniMax]]

  • [[Mistral]]

强化学习

  • [[LLM 中强化学习讨论]]

其他

  • [[NLP 数据增强方法]]

作者

Ryen Xiang

发布于

2024-10-05

更新于

2025-04-23

许可协议


网络回响

评论