离散化 相当于非线性变换

  1. 划分方式

    1. 等样本分bin (对幂率分布可能更好)
    2. 等区间分bin
    3. 基于取值-后验目标(ctr等)曲线找个各个非线性变化点分bin
    4. 基于信息熵和假设检验等方式
  2. 注意事项

    1. bin的数目不宜过少(区分度小) 或过多(样本不充分并且容易bin间跳跃)

results matching ""

    No results matching ""