楠木轩

AWS在中国:拆掉机器学习成本“高墙”

由 廉拥军 发布于 科技

近日在2020 AWS技术峰会与合作伙伴峰会上,关于中国市场,AWS宣布了一个重要动作:发布百家APN(AWS合作伙伴网络)合作伙伴联合解决方案。

具体来讲,AWS在中国将从四个方面推动APN的构建:一是加快AWS云服务和功能落地中国;二是推动跨区域业务扩展,包括伙伴出海、ISV落地中国、和区域伙伴合作服务客户;三是与伙伴着力传统企业上云迁移;四是打造垂直行业解决方案。

AWS大中华区专业服务事业部总经理王承华表示,AWS仅在今年在中国区就一共落地了150多项服务和功能,主要原因有三点:

  • 一是大数据分析,通过大数据分析挖掘商机,是数字原生企业的成功之处。这也是如今大量传统企业在思考的事情,他们希望通过大数据运营解决日常运营中的问题,同时进行创新。比如很多快消企业在尝试如何直达消费者(B2C),涉及到大量数据与运算。

  • 二是AWS在中国区引入了Amazon Athena、AWS Glue、Amazon MSK,与此前的Amazon S3、Amazon Elasticsearch、Amazon Redshift、Amazon EMR等组成一套数据湖解决方案,为向行业推进奠定了技术基础。

  • 三是机器学习方面,目前各行业也在探索如何从海量数据集过往经验中总结出适合于自身行业突破的机器学习解决方案。今年4月,AWS中国区引入了一项重要服务SageMaker,以减少对传统科学家和工程算法的依赖,有效节省科学家和数据工程师的时间。

显然,受国内疫情带来的数字化需求浪潮推动,借助光环新网(北京)、西云数据(宁夏)的运营,AWS正在加快在中国市场的落地与布局。

企业数字化的增长引擎

提起SageMaker,对于中国的企业可能还是个新鲜事物。

SageMaker于2017年公布,2020年4月正式上线中国区。据介绍,SageMaker是一项完全托管的服务,可以帮助开发者和数据科学家快速构建、训练和部署机器学习模型。SageMaker为开发者提供了弹性笔记本、实验管理、自动模型创建、模型调试分析,以及模型概念漂移检测等功能,并将这些功能封装在首个面向机器学习的集成开发环境SageMaker Studio中。

这种类似于“中央厨房”的模式,消除了机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。 

此次活动上,AWS中国区生态系统级合作伙伴总经理汪勇进一步说明了企业选择SageMaker的理由:“数字化已经成为新常态,为加强在垂直行业的深耕,AWS已经通过与中科创达、行者AI、东软、德勤等技术/咨询合作伙伴的合作,帮助客户定制开发人工智能、机器学习解决方案,加大创新速度和在本地服务落地的速度。”

谈及这一点,作为与AWS合作近10年的客户伙伴之一的德比软件,其最佳实践或许比AWS的阐释更具有借鉴性。

基于SageMaker的实践创新:酒店库存智能缓存

德比软件是一家为酒店、OTA提供订单分销技术的企业,其客户遍布全球,包括希尔顿、洲际、万豪等国际著名连锁酒店。分销技术,简而言之,就是当消费者通过携程或谷歌搜索预定酒店时,需要保证对酒店库存、价格等实时信息的更新,德比软件相当于这样一个信息的对接平台。

据德比软件副总裁夏卫介绍,

“德比软件平台上,每分钟有一百多份订单,至少需要2000台服务器来处理业务。除了在中国市场,在亚洲、欧洲、美洲等地都需要部署服务器,每天处理的数据量也达到了近200TB以上。如果使用传统服务器进行部署,那么系统架构将变得非常复杂,且企业运营成本也居高不下。”

为此,德比软件从2011年开始就使用AWS,如今其业务几乎100%都跑在AWS云上,对德比软件全球的扩张起到很大的支撑作用。

随着2020年SageMaker在中国市场的落地,AWS上海人工智能研究院机器学习解决方案实验室基于SageMaker,为德比软件开发了一款酒店库存智能缓存系统。

夏伟告诉雷锋网,在使用SageMaker之前,德比软件也曾尝试引入机器学习应用在某些项目中,如智能运维、容量预测、异常检测等。

“起初,我们还做了一个库存预测和异常检测的神经网络模型,运行在AWS EC2上。如果是小规模运算,针对某个产品、项目没什么问题,计算资源也耗费不多,但如果需要在整个公司内部运作起来,调度几千台服务器,这种方法肯定就不行了,首先成本就非常高。

此外,数据调用、数据量、安全合规等问题都是需要考虑的问题。”

夏伟表示,酒店库存的变化有很多要素影响,包括不同的入住日期、入住天数、成人数量、儿童数量甚至儿童的年龄段、不同房型、不同价格计划,以及针对不同的渠道等等,这些要素组合起来,当对接一家有6000家连锁酒店的集团集团酒店时,差不多有一万多亿的变化。

考虑一番后,德比软件迁移到SageMaker 的Pipeline上实现。

通过酒店库存智能缓存系统,可以实现分析实时查询价格的请求数据,以及十多年来的历史订单数据,从而自动找到酒店库存变化的规律;然后通过周期性训练,最终得到能够预测除热门以及易变化酒店的酒店产品模式,实现及时更新缓存,并根据预测的产品状态过期时间,快速推送给渠道。

接下来,德比软件还规划通过SageMaker构建以下几方面核心能力:一是酒店内容上,包括图片、文字描述,如房型名称可以通过NLP进行训练生成;二是如何将原先需要手工录入的信息实现自动化;三是在智能客服方面,通过技术推广到更多中小酒店。

据初步测试,这套算法可以帮助德比软件提高准确率20%以上。尽管还是初步的尝试,完全成效还未体现出来,但按照德比软件目前在全球的订单量,在全面部署后,每提高5%,也可能为客户带来10亿美元的额外收入。

雷锋网注意到,这次峰会上AWS还宣布与毕马威、神州数码签署战略合作关系,在更多领域深化合作。例如,东软集团基于AWS构建了云原生的汽车在线导航业务(NOS),速石科技构建的基于AWS云上资源和用户本地算力的一站式交付平台,外研在线在AWS上构建的Unipus智慧教学解决方案等等……

不难发现,包括AWS这样的云巨头服务商在内,当下云市场已经从单纯云技术的输出,真正转变为云生态之间的竞争。

(雷锋网)