类似 automl 的特征字典
可以考虑维度
- count:#card
- A_COUNT、B_COUNT、A_B_COUNT
- nunique:#card
- A_nunqiue_B (按B对称的下文省略)
- ratio:#card
- A_B_COUNT/A_COUNT 在A里各个B类所占的比例
- average:#card
- A_COUNT/A_nunqiue_B A里各个B类的平均数
- most:#card
- A_most_B 在A类里出现最高的B是哪个
- pivot:#card
- A_B1_count、A_B2_count A和B类里特定的B1、B2的联合统计
- A_B1_count-A_B2_count A的B1行为和B2行为的加减乘除
- stat1:#card
- A_stat_A_B_COUNT 基于A_B_COUNT对A的描述,
- A_stat_B_COUNT 基于B_COUNT对A的描述,
- 序列化:#card
- 初步LDA,NMF,SVD,
- 进一步Word2Vec,doc2vec
- 再进一步 图神经网络deepwalk,pPRoNE
网络回响
类似 automl 的特征字典