类似 automl 的特征字典

可以考虑维度 #card

  • count:A_COUNT、B_COUNT、A_B_COUNT
    nunique: A_nunqiue_B (按B对称的下文省略)
    ratio: A_B_COUNT/A_COUNT 在A里各个B类所占的比例
    average:A_COUNT/A_nunqiue_B A里各个B类的平均数
    most: A_most_B 在A类里出现最高的B是哪个
    pivot: A_B1_count、A_B2_count A和B类里特定的B1、B2的联合统计
    pivot2: A_B1_count-A_B2_count A的B1行为和B2行为的加减乘除
    stat1: A_stat_A_B_COUNT 基于A_B_COUNT对A的描述,
    stat2 :A_stat_B_COUNT 基于B_COUNT对A的描述,
    序列化:初步LDA,NMF,SVD,进一步Word2Vec,doc2vec 再进一步 图神经网络deepwalk,pPRoNE

作者

Ryen Xiang

发布于

2025-04-20

更新于

2025-04-20

许可协议


网络回响

评论