作者:杨夕
NLP 百面百搭 地址:https://github.com/km1994/NLP-Interview-Notes
推荐系统 百面百搭 地址:https://github.com/km1994/RES-Interview-Notes
关注公众号 【关于NLP那些你不知道的事】 加入 【NLP && 推荐学习群】一起学习!!!
注:github 网页版 看起来不舒服,可以看 手机版推荐系统百面百搭
- LR 表达能力不强问题。由于LR表达能力不强,导致模型学习的时候,有效信息容易丢失。
- 单一特征存在信息损失问题。在仅利用单一特征而非交叉特征进行判断的情况下,有时不仅是信息损失的问题,甚至会得出错误的结论。
- 手动构建组合特征,再筛选的方法比较低效问题。
PLOY2模型 采用 “暴力”组合 的方式对特征进行交叉。
该模型对所有特征进行了两两交叉(特征
- 特征稀疏问题。在处理互联网数据时,经常采用 one-hot 编码的方法处理类别型数据,致使特征向量极度稀疏,POLY2进行无选择的特征交叉——原本就非常稀疏的特征向量更加稀疏,导致大部分交叉特征的权重缺乏有效的数据进行训练,无法收敛。
- 复杂度增加问题。权重参数的数量由n直接上升到n^2,极大地增加了训练复杂度。