2026-02-172026-02-17 随手记 3 分钟读完 (大约486个字) 0次访问

Standardization

标准化的前提假设

不适合情况

什么数据适合标准化？

标准化后损失什么信息？

什么时候需要标准化

主要看模型是否具有伸缩不变性。
有些模型在各个维度进行不均匀伸缩后，最优解与原来不等价，例如SVM。对于这样的模型，除非本来各维数据的分布范围就比较接近，否则必须进行标准化，以免模型参数被分布范围较大或较小的数据dominate。
有些模型在各个维度进行不均匀伸缩后，最优解与原来等价，例如logistic regression。对于这样的模型，是否标准化理论上不会改变最优解。但是，由于实际求解往往使用迭代算法，如果目标函数的形状太“扁”，迭代算法可能收敛得很慢甚至不收敛。所以对于具有伸缩不变性的模型，最好也进行数据标准化。

Standardization

Ryen Xiang

2026-02-17

2026-02-17