016 | The Web 2018论文精读：如何对商品的图片美感进行建模？

洪亮劼



该思维导图由 AI 生成，仅供参考

“万维网大会”（The Web Conference 2018）前身叫作“国际万维网大会”（International World Wide Web Conference），从 1994 年开始举办，已有 20 多年的历史了，在 Google 学术排名上，是“信息系统”排名第一的国际顶级学术会议。
从万维网大会最初举办开始，这个会议就成为了互联网方面独一无二的权威学术会议。会议包含搜索、推荐、广告、数据库、信息提取、互联网安全等诸多领域的优秀论文，每年都吸引着上千名世界各地的学者和工程师来分享他们的最新研究成果。
2018 年的万维网大会于 4 月 23 日~27 日在法国里昂举行。整个会议收录了 171 篇论文，还有 27 个研讨班（Workshop）、19 个讲座（Tutorial）、61 个展板论文（Poster）和 30 个演示（Demo）。
万维网大会的一大特点就是论文成果涵盖了非常广的领域。要在这些论文中找到有价值的学习信息是一件非常耗时、很辛苦的任务。这里给你分享几篇我认为今年这个会议上最有价值的论文，希望能起到抛砖引玉的作用。
今天，我们就来看一篇优秀论文提名，题目是《基于美感的服装推荐》（Aesthetic-based Clothing Recommendation）。这篇论文一共有六位作者，除了两位分别来自新加坡国立大学和美国的埃默里大学之外，绝大多数作者都来自清华大学。
论文的主要贡献在现代的电商推荐系统中，商品特别是服装服饰的图片，其美观和质量是用户进行购买决策的关键参考因素。不少过去的商品推荐系统已经考虑了图片的属性，特别是尝试同时利用图片信息和文字信息来实现多模（Multi-Modal）数据理解的目的，从而能够进行更加智能的推荐。不过，当前的大多数方案都只是考虑基本的图片特性。
从思路上来说，大多数的类似工作都是利用某种深度神经网络提取图片特性，然后和其他特性（例如我们说过的文本信息）加以组合，从而能够扩宽我们对商品信息的提取。这样提取出来的图像特征自然没有显式地对图像的“美感”（Aesthetic）进行建模。
这篇文章的作者们认为，商品图片的“美感”是非常重要的属性，针对美感进行建模会有更显著的商品推荐效果。概括来说，这篇论文的一个贡献就是提供了一种模型，来对图片的美感和一般性的图片语义特性同时进行建模。这是一个在过去的工作中都没有的创新点，我们接下来会详细说明一这个模型的架构。
当作者们提取出了图片的美感信息以后，接下来的一个问题就是如何利用这些特性。这篇论文使用了张量分解（Tensor Factorization）的思路。我们在前面介绍推荐系统的时候曾经提到过，张量分解是一种很有效且常用的利用上下文语义信息的推荐模型。和一些之前的工作类似，这里作者们采用了三维的张量来表达用户、商品和时间之间的关系。同时，作者们还把图片信息有效地结合到了张量分解中，从而能够利用美感信息来影响推荐结果。
论文的核心方法了解了这篇论文的大体思路以后，我们现在来看看论文的第一个核心部件：如何利用深度神经网络来提取图片的美感信息？

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

《基于美感的服装推荐》论文介绍了一种新颖的模型，该模型能够同时对商品图片的美感和语义特性进行建模，并将这些信息融入到推荐系统中。作者利用深度神经网络提取商品图片的美感信息，并将其与张量分解模型相结合，提出了一种“动态协同过滤”方法来进行商品推荐。实验结果表明，在亚马逊的衣服数据集上，该模型表现出明显的优势，证明了针对产品的图像美感进行建模的价值，并且新的张量分解方法也被证明是切实有效的。这篇论文的创新点在于提出了同时考虑商品图片美感和语义特性的模型，并将其应用于商品推荐系统中，为电商推荐系统的发展提供了新的思路和方法。该研究为解决电商推荐系统中的挑战提供了有益的思路，也为无标签情况下对图片美感进行建模提供了启示。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论