主流CTR模型
CTR CTR,Click-Through-Rate,也就是点击率预估 ,指的是精排层的排序。所以 CTR 模型的候选排序集一般是千级数量。 CTR 模型的输入(即训练数据)是:大量成对的 **(features, la…
Simple And Naive
CTR CTR,Click-Through-Rate,也就是点击率预估 ,指的是精排层的排序。所以 CTR 模型的候选排序集一般是千级数量。 CTR 模型的输入(即训练数据)是:大量成对的 **(features, la…
强化学习 任务与奖赏 在状态之间通过不同的操作使目标保持好的状态则能得到奖赏,否则惩罚(奖赏值为负) 机器通过在环境中不断尝试以获得策略,而好的策略会得到较大的奖赏值 与监督学习的区别是在这里样本没有标记,机器没有被直接…
规则学习 “规则” 指语意明确,能描述数据分布所隐含的客观规律或领域概念;规则学习指从训练数据中学习出一组能用于未见实例进行判别的规则 命题规则:由原子命题【与,或,非,蕴含】组成的简单陈述句 一阶规则、关系型规则:在1…
半监督学习 未标记样本 因为未标记样本与标记样本符合同一个模型生成(假设),因此希望学习器通过未标记样本来提高学习性能 生成式方法 假设所有数据由一个潜在模型生成,假设一种模型,通过极大似然估计求解(EM法) 通过当前模…
聚类 性能度量 or 有效性指标 两样本在同一个参考模型类中 两样本不在同一个参考模型中 两样本在同一个聚类类中 a=|SS| c=|DS| 两样本步子同一个聚类类中 b=|SD| d=|DD| avg(C) 样本间平均…
贝叶斯方法 贝叶斯决策论 基于概率和误判损失来选择最优标记 当属性是离散的: 类的先验概率 = 该类样本数量 / 样本总数 极大似然估计 通过极大似然估计得到的正态分布均值=样本均值,方差=(x-\\overline{u…
神经网络 包含隐层的网络即可称为多层神经网络 误差逆传播算法(BP) 对网络在数据集上的均方误差对各层权值做偏导,即可算出各个参数的梯度下降更新值 学习率控制了学习过程中每一轮迭代的更新步长 BP算法的目标是最小化训练级…
基本 奥卡姆剃刀原则 若有多个假设与观察一致,则选最简单的那个 “没有免费的午餐”定理(NoFreeLunch Theorem) 在所有问题出现机会相同时,所有算法期望性能相同 评估方法 留出法 将数据集划分为两个互斥的…