2026-02-172026-02-17 随手记 3 分钟读完 (大约461个字) 0次访问

Multi-Task Learning

基本网络框架 [[底层共享法]]

结构

Optimization

两大分支：”网络设计” 以及 “损失函数设计”

关键点

网络设计

参考 [[神经网络与深度学习]]
网络如何小巧轻便，如何最大幅度的让不同的任务去共享信息。
Hard parameter sharing 底层共享参数，最上层有不同的任务。
- Task 越多，单任务越不容易拟合
- 底层难以学到试用于所有任务的表达，比如多任务：猫狗分类，猫汽车分类
Soft parameter sharing
- 不同任务的参数空间需要添加限制，不然容易变成 single task learning
层次共享
- 图像中不同层次的表达能力不同：结构提取、语义提取
共享-私有
Cross-Stitch Network、Multi-Attention Network、AdaShare、MTL+NAS 可以参考 “综述性质的文章Multi-task Learning and Beyond: 过去，现在与未来 - 知乎“

损失函数设计

类似方向 [[Auxiliary Learning]]

[[Ref]]

Multi-Task Learning

Ryen Xiang

2026-02-17

2026-02-17