InfoQ前Uber CTO加入韩国最大电商公司Coupang( 三 )


  • 以 QueryJoin 为例 , 生成 QueryJoin 的过程如下:
首先加载所有源数据 , 包括 ground truth 数据和已解析的会话日志。 其次在查询级别和商品查询级别生成内置的聚合原始顾客行为数据 , 例如曝光量、点击数、购买数、收益 。 再次处理所有 Signal 处理器 , 生成 Signal 。 最后将 QueryJoin 和所有 Signal 存储到 Hbase 。
  • 每个处理器的工作流 (workflow) 如下:
从效率的角度来看 , 以前创建一个新的 Signal , 从解析原始日志到创建 signal , 需要建立一个完整的 pipeline 。 通常 , 生成一个新 Signal 需要许多 Hive 查询 /Spark job , 要花费数小时 。 而 Coupang 有大约 70 条这样的 pipeline , 维护它们几乎是一场灾难 , 造成了巨大的资源浪费 。 在索引平台 2.0 中 , 解析日志和生成原始 Signal 的功能是一体的且由平台自身提供的 , 添加新 Signal 只需实现一个 Class 并添加一些逻辑来处理在新平台上几乎免费的数据 。
  • Indexing Bus 索引总线使用前后效率对比

InfoQ前Uber CTO加入韩国最大电商公司Coupang
本文插图
综上 , 通过索引平台 2.0 , 可以实现:
  • Ranking 开发人员可以在几小时内创建一个新的 Ranking signal , 完全专注于 Signal 的逻辑和公式 。
  • 节省了大量的 EMR 资源 , 并可几乎免费在索引平台 2.0 中添加新的 Signal 。
  • 提供单元测试或集成测试 , 以确保 Signal 质量 。
由此不难看出 , 索引平台已经成为 Coupang 业务的核心大脑 。 而关于索引平台的迭代与升级并没有结束 , 这仅仅是个开始!在 Product 和 Query 之间建立关系 , 只是平台的第一步 。 未来 , Coupang 将在顾客、商品、查询、品类、品牌等之间建立类似的关系 , 并应用于推荐、广告等其它业务中 。
除了索引平台技术的持续进化对业务带来的增益 , Coupang 还与京东一起联动 , 以庆祝“11.11”这个全球最大电商狂欢节 。 此次进行的限定 3 日活动中 , 韩国消费者可以在 Coupang 上以超优惠的价格购买京东网站上实际销售的全球各品牌商品 。
在 Coupang , 韩国消费者可以通过 Coupang 便捷的购买与结算系统 , 无需经历复杂而困难的海淘过程 , 就能直接轻松购买海外商品 。 所购商品无论重量 , 体积 , 数量 , 一律包邮 。 配送速度也较以往提升了许多 , 通常需花费 2~3 周时间的配送 , 通过中国当地京东的物流仓库 , 预计可以直接缩短至 5~7 天内完成 。
Coupang 高级总监乔纳森·巴克斯(Jonathan Burks)表示:“我们与中国领先的在线购物商城京东举行合作促销活动 , 是为了让 Coupang 的顾客也能体验中国最大的购物节光棍节的优惠活动“ 。 他还说“今后我们将推出更多的商品 , 更多样化的优惠活动 , 让韩国消费者可以轻松购买国际品牌乃至来自海外各国的优质商品 。 ”
技术的价值 , 莫过于此 。
【InfoQ前Uber CTO加入韩国最大电商公司Coupang】