eBay在机器学习方面的经验给IT专业人员带来了什么启示?

译文
新闻 CIOAge
eBay一直在收集数据和使用机器学习,为更多的买家和卖家牵线搭桥,并提高交易的可信度。如果IT专业人员期望通过将机器学习运用于面向客户的应用系统,以此帮助提高公司的经营收入,那么eBay的几种使用场合就值得好好探究。

【51CTO.com快译】eBay在运用机器学习方面的经验主要是改善客户与其网站的交互方式。四年来,eBay一直在收集客户搜索数据,以及搜索点击率及其他客户交互数据,并将这些信息馈送到机器学习系统。

该公司的工程副总裁丹·费恩(Dan Fain)在一次采访中道出了他们所采取的措施以及背后的商业动机。费恩称,搜索、客户点击模式、语言翻译、货品推荐和图像分析都是eBay运用机器学习的几种方式。

他表示,机器学习第一种也是最重要的应用就是,改善eBay.com上的搜索功能,“我们后台有几种机器学习模型在运行,确保我们获得最佳的搜索结果。”

由于有10亿多个货品在卖,在eBay上搜索时,许多方面会容易出错。比如,很多搜索会依赖顾客选择的单词和短语。有人搜索“缝纫机”,那么他或她可能是想要自行缝纫所使用的东西。

但机器学习表明,人们有时在寻购老一辈过去使用的那种缝纫机或者是收藏者眼里属于古董的“收藏品”时,搜索会触发系统检查eBay的在售缝纫机款式库存。机器学习模型也许能够从查询访客的购物历史来做出一番推断。它们也会检查在网站上搜索缝纫机的其他访客的行为,来判断访客们是不是浏览后就走人了?或者他们找到一款现代缝纫机后就止步了吗?四处寻购老式缝纫机的人从哪些方面显示了他们的兴趣?

再比如,另一个搜索短语“配皮表带的瑞士手表”。这给网站提出了不同的挑战,但机器学习应对得了。通常的搜索会返回长长的瑞士手表名单以及同样长长的皮表带品牌名单。如果搜索的人想要寻找二者兼具的一个产品,那这类搜索结果就不是很有用。

[[178803]]

费恩说:“在这个查询中,一个类别不该把另一个类别排斥在外。”尽管这类搜索可能每年只有几次,但系统考虑到了长尾,提出了最佳匹配结果。通过分析之前的搜索,eBay搜索引擎就能把只是偶尔出现的几个单词联系起来。

搜索引擎经过一番训练,可以认真地判断搜索属于哪一类,然后对照搜索者对什么感兴趣的其他线索,检查这个类别的内容。在上述搜索例子中,一个线索就是某皮表带品牌的一款流行的瑞士手表已经在热卖。

 

激烈的竞争

2015年年底,费恩表示,eBay声称拥有1.62亿活跃买家。到2016年8月,这个数字已增加到1.64亿。适度增长对一家收入持平或下滑的公司来说意义重大。竞争很激烈,顾客随时会去光顾其他的电子商务网站。

费恩的团队越能运用机器学习,确保顾客精准地找到搜索的货品,搜索导致购物的可能性就越大。潜在买家也更有可能相信他们获得的信息。

机器学习还让这个网站在处理国外买家的查询方面更高效。这些人可能用本国语查看货品描述,未必明白原始语言的惯例。比如,同样搜索带金属小饰物的巴宝莉手袋,对于说西班牙语的买家和说英语的买家要给予不同的对待。

有了eBay基于机器学习的翻译功能,不会说英语的网站访客比过去更容易完成购买了。不管顾客在世界上的什么地方或者说什么语言,顾客能够明白所售货品的介绍和价值,这点很重要。

为此,eBay为自己的搜索引擎增添了一种“最佳匹配”算法,分析对买家了解什么、哪些是热销货品、某些货品对潜在买家有怎样的价值。这类匹配体现了eBay“最大规模地运用机器学习的做法。”费恩说,“这是一种挖掘商机的有效工具。”

比如,在上述的缝纫机搜索例子中,“最佳匹配”响应会根据价格值不值来显示缝纫机。如果搜索者是桌面用户,eBay在屏幕上有地方来显示排名的最佳匹配结果,以及访客可能会搜索的额外类别,比如“古董”或“收藏品”。

但在智能手机或其他移动设备上,屏幕空间不够大,显示不了太多的补充信息。费恩称,这是个问题。因为如今在eBay上达成的一半业务量是来自某种移动设备。如果想要采取另外一步,移动用户会得到一个链接,在新的屏幕上打开其他类别。

除了竭力让搜索尽可能准确外,eBay还热衷于让搜索体现市场价值,比如将货品价格很值的结果显示在价格不太值的那些货品上面。

交易的可信度也是eBay关注的一大优先事项。它利用机器学习发现哪些因素表明可信度――比如卖家成功完成交易的比率,而哪些因素无法表明可信度。反过来,如果卖家方面有一连串投诉或问题,搜索结果就会下调到列表靠后的位置。

通过使用机器学习,eBay旨在确保买卖双方都满意而归。进行交易时,系统会问:“这笔交易将满足我们标准的可能性有多大?”费恩说,“结果基于证据力度,这由机器学习来决定。”

 

不仅仅着眼于点击

费恩将自己在雅虎工作的五年(他要面对的主要证据是页面点击)与关于eBay用户的大量信息作了一番比较。

他表示,点击告诉系统某货品引起了访客的注意,但除此之外帮助不大。而在eBay,系统可以研究带来购买的点击流。“购买是一个极其有效的证据”,馈送到机器学习系统,那样eBay完全有能力收集购买证据,并且高效地利用起来。

现在,eBay工程部门在利用机器学习,更准确地了解eBay上所用图像的质量,从而确定什么才是促成交易的出色图像质量。它可以运用集群中图形处理单元的强大并行处理功能,分析访客与图像之间的交互。费恩说:“借助GPU的专用处理功能,我们能够迅速处理多得多的例子”,因而从庞大的实际eBay数据集获取经验教训。

虽然费恩没有提到具体有多少台服务器专门用于机器学习,不过他表示有好几个集群。eBay发觉机器学习是一种宝贵的工具,正在购置更多的机器学习硬件,招聘拥有机器学习技能的技术人员,并且启动另外的机器学习项目。费恩表示:“机器学习是我们的一大投入领域。”

原文标题:What eBay's Machine Learning Advances Can Teach IT Professionals,作者:Charles Babcock

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

责任编辑:wangxuze 来源: 51cto.com
相关推荐

2024-01-02 14:21:33

2022-02-20 10:35:05

僵尸网络网络攻击

2015-10-09 10:15:41

大数据公司

2023-05-29 08:49:04

ITCIO教学

2015-08-19 13:10:35

大数据网络运营

2012-07-20 10:36:03

虚拟化

2015-08-07 09:03:08

openSUSE软件

2021-09-26 13:51:50

混合ITNetOps网络

2018-05-17 15:43:40

IT

2018-03-13 12:37:59

JavaHadoop大数据

2016-06-16 17:50:39

云计算云安全

2020-03-09 18:34:50

ServerlessDevOps前端

2020-10-14 11:16:06

5G边缘计算

2019-05-20 15:45:18

区块链数据中心数据

2020-03-08 11:31:15

渗透测试网络攻击安全工具

2010-12-27 14:26:52

2016-11-03 10:03:49

云计算容器超融合

2009-12-29 09:13:33

Windows 7十大使用须知

2023-04-20 15:01:01

光纤铜缆

2017-12-12 16:13:53

IT人工智能计算机

51CTO技术栈公众号