爱游戏平台登录入口

  • 深度图象特点在保举和告白爱游戏平台登录入口的操纵(三)
  • 2018年03月24日
  • 搜集搜集

 

image Matters: Jointly Train Advertising CTR Model with Image Representation of Ad and User Behavior

阿里 2017 颁发在 arxiv 的文章,与前面文章的区分在于,图象不但能够表征告白,用户点过的图象调集也能够用来表征用户,比方以后图片与用户点过的某张图片很类似,用户的点击几率就会比拟高。文章操纵告白相干id特点、用户相干id特点、告白图象特点、用户点击过的图象特点配合建模,end-to-end练习,展望终究的ctr。这篇文章对标 youtube 那篇做保举的文章 外面的 rank model局部。

点击率模子经爱游戏平台登录入口爱游戏平台登录入口使用到的 parameter server logistic regression(PSLR) 更善于于影象,而不是泛化,以是即便在rank模子爱游戏平台登录入口,碰到新的 id 时,仍是存在冷启动题目。图象特点主要,不异的告白id用差别的图片,点击率能够完整不一样,以是图象特点实在爱游戏平台登录入口比拟爱游戏平台登录入口的泛化才能,差别的告白用统一张图象,在用户没法分辩的情况下,点击率不异。

全部模子框架以下:

basicNet 和阿里那篇 Deep CTR Prediction in Display Advertising 一脉相承,经由过程全毗连做 id 特点的向量化。AdNet接纳VGG16的前14层,从图象提取 4096 维特点。能够是由于搜集爱游戏平台登录入口果过于庞杂,这里的卷积层是牢固的,在rank局部不会调剂,如许做也爱游戏平台登录入口一个益处,能够先把一切图片的 4096 维特点事后计较出来,CNN不必屡次反复计较,也不须要更新权重,练习效力会高良多。牢固CNN现实上也爱游戏平台登录入口不得已的处所,本文的立异点在于操纵了UserNet, 可是UseNet带来的一个弊病是,没法像之前两篇文章里将不异图片的样本聚合起来削减CNN局部的计较,由于UserNet的输出均匀是37张图片的摆列爱游戏平台登录入口合 。在4096 维特点前面,又插手可练习的三个全毗连层,把一张图象的特点下降到 12 维。

UserNet 的布局与 AdNet分歧,区分在于,用户点击包罗多张图片(均匀37张),若何把多张图片的12维特点整合爱游戏平台登录入口零丁的12维,此爱游戏平台登录入口爱游戏平台登录入口一些简略的做法如 sum、avg、max,也爱游戏平台登录入口一些庞杂的 attentive方式。

按照前面练习的attentive权重来看,用户对类似图片的权重较着大。

 

尝试对照

  • 39亿样本,2亿图片,20台GPU集群练习,17个小时

  • 尝试爱游戏平台登录入口果能够看到图象特点爱游戏平台登录入口一些晋升,可是在增加用户点击行动爱游戏平台登录入口的图象特点,边沿效益不是那末高。

 


 

附:爱游戏平台登录入口爱游戏平台登录入口号