比如网页类别 取值太多放入模型可能达不到预期的效果,一般会根据取值的权重进行截断

方法:

  1. 简单的去权重最大的前N个
  2. 从权重最大的开始取,累计权重的阈值
  3. 当前后两个权重比值超过一定阈值时终止
  4. 前3种方法组合使用

results matching ""

    No results matching ""