仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-163-302
请扫码咨询

新闻动态

NEWS CENTER

用户希望看到自己感兴趣的产品排到前面

2023-08-29

问题可所以详细的用户需求,比方:用户希望看到自己感兴趣的产品排到前面;也可所以目前事务面临的问题,比方:目前渠道GMV渗透率高的品类曝光流量缺乏,这些其实都是问题。可是关于运用算法模型来处理的话,要害点在于如何把这个问题变成算法模型能了解,能处理的问题。

因此这里边必定涉及到一个如何从感性的问题描述转变为一个可以让模型去了解和猜测的问题。

这就到了第二个环节:问题建模。

二、问题建模

问题建模的要害其实就两个:事务方针界说和模型猜测方针界说。

事务方针界说即根据当时事务核心场景去界说核心事务方针,这块涉及到一些数据方针体系搭建。

模型猜测方针主要用于根据该方针去设定模型的收敛方针,也便是模型要猜测什么,输出什么值。典型的比方ctr预估,实际上便是输出了ctr这个值。

在问题建模阶段,还有两个重要的事情:样本选择和交叉验证。

简言之,我们从原始数据(日志)傍边选择跟当时模型预估方针相关的样本,然后把这些样本分为训练集和测验集,然后通过交叉验证的办法对模型进行训练和评价。

这块不得不提一下关于模型评价的方针。方针的分类有许多,最常见的其实便是准确率、召回率、AUC曲线等,包含常见的NDCG是对排序模型的衡量要害方针。

三、特征工程

完成了问题界说和问题建模,接下来就进入了很要害的特征工程,从很多的数据傍边进行特征抽取,核心目的是为了将特征输入给模型,让模型从数据中学习规律。

最为要害的是下面这张图:


榜首点好了解,特征是为方针服务的,因此选择出来的特征有必要可以表征方针;

第二点的意思是这个特征要在不同的物品之间有适当明显的差异。比方销量,有的高,有的低;评价,有的是100%好评,有的是80%好评,这些都可以称之为特征。

可是,假如你们事务的基本上99%的物品好评率都在100%,那基本上这个特征就不必加了。

有差异才有区别,有区别才干作为一个决议计划的因素。

相关推荐