您好!欢迎访问欧宝体育登录网页官方网站

当前位置:首页 > 新闻中心 > 行业动态

欧宝体育登录网页:用户画像的核心技术盘点

时间:2022-08-13 04:47:51 来源:欧宝体育代理网 作者:欧宝最新地址

  在互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据,这是企业经营活动的真实记录,

  随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。

  工欲善其事必先利其器,如果对于画像系统没有一个深入的、体系化的理解,那么对整个项目的开发规划,落地应用规划都是一盘散沙。项目建设虎头蛇尾,最后不了了之。对于画像系统的深入理解包括理解画像系统的建设目标、应用场景、需要使用的大数据技术选型方案和开发涉及的主要步骤,画像产品的设计形式及应用场景方案等多个方面。

  整个工程化方案中,系统依赖的基础设施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除去基础设施外,系统主体还包括Spark Streaming、ETL、产品端3个重要组成部分。(下图是画像系统数据架构设计)

  开发画像系统需要掌握的大数据技术包括:数据仓库建模理论和方法;会使用Scala、Java或Python语言进行Spark开发,离线批处理/实时数据处理;掌握Hbase、Elasticsearch等数据存储工具的使用。

  在画像系统开发过程中也需要开发者具备一定的数据分析思维,例如在开发RFM模型对应的标签前,先需要进行数据调研。根据对数据仓库中拉取的用户消费相关数据进行分析后得出用户这3个维度的指标在数值上划分的界限。

  根据累计用户量的占比,可按照二八比例进行划分,将最近一次交易时间距今0到90日的用户划分为近,将90日以上的用户划分为远。

  根据累计用户量的占比,按二八比例进行划分,将历史交易订单量在3单以下的用户划分为低频,将交易订单量在3单及以上的用户划分为高频。

  根据用户近一年交易金额情况,将交易金额在300元以下的用户划分为低额,交易金额大于300元的用户划分为高额。

  画像系统最终的目标是帮助数据走出数据仓库落地应用在业务场景上,促进业务质量提升(如流量增加、营收增加、用户体验改进等方方面面)。

  画像产品化开发、接口服务开发需要开发者掌握Java web的开发能力。虽然对于数据开发人员来说这不是必备的能力,但是对于一个希望具备全栈开发能力的开发者来说,掌握该项技术,有助于深入理解画像的数据流、产品设计的背景和意义、画像系统落地支撑业务的技术细节。

  关于作者:赵宏田,资深大数据技术专家,先后在中国地质大学(武汉)和武汉大学获得工学和经济学双学士学位。在大数据、数据分析和数据化运营领域有多年的实践经验,擅长Hadoop、Spark等大数据技术,以及业务数据分析、数据仓库开发、爬虫、用户画像系统搭建等。

上一篇:审计观察 深入系统理解“十四五”规划 以高度政治责任感加强审计监督 下一篇:从十个方面深入理解MongoDB

地址:郑州市郑东新区崇德街17号星联创科中心7层

All Rights Reserved CopyRight 2014-2019 欧宝体育登录网页-代理网最新地址

电话:400-006-1107

邮箱:service@55574111.com