类似 automl 的特征字典

可以考虑维度

  • count:#card

    • A_COUNT、B_COUNT、A_B_COUNT
  • nunique:#card

    • A_nunqiue_B (按B对称的下文省略)
  • ratio:#card

    • A_B_COUNT/A_COUNT 在A里各个B类所占的比例
  • average:#card

    • A_COUNT/A_nunqiue_B A里各个B类的平均数
  • most:#card

    • A_most_B 在A类里出现最高的B是哪个
  • pivot:#card

    • A_B1_count、A_B2_count A和B类里特定的B1、B2的联合统计

    • A_B1_count-A_B2_count A的B1行为和B2行为的加减乘除

  • stat1:#card

    • A_stat_A_B_COUNT 基于A_B_COUNT对A的描述,

    • A_stat_B_COUNT 基于B_COUNT对A的描述,

  • 序列化:#card

    • 初步LDA,NMF,SVD,

    • 进一步Word2Vec,doc2vec

    • 再进一步 图神经网络deepwalk,pPRoNE

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-25

许可协议


网络回响

评论