Online-to-Offline( 简称 O2O)电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式。 O2O 商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚拟世界的渠道; 线下商业可以到线上挖掘和吸引客源,而消费者可以在线上筛选商品和服务并完成支付,再到实体店完成余下消费。 它最先由 TrialPay 创始人 AlexRampell提出,在 2006 年沃尔玛公司的 B2C 战略中予以应用,随后以网络团购形式为大家所熟知。 目前 O2O电子商务与社交网络和移动终端紧密结合,除网络团购之外,还出现了移动优惠、签到、个性推荐等基于位置的增值服务等商业形态; 从事 O2O 电商的企业更是数以万计,除了 Foursquare、大众点评网、拉手网等后起之秀外,还不乏 FaceBook、Twitter、腾讯和百度等业界巨鳄也在迅猛跟进; O2O 电商交易额也迅速放大,2011 年大众点评网营业额已破 10 亿元; 与交易猛增随之而来的是爆发式增长的 O2O 电商数据,大众点评网目前每天的活跃数据量已经超过10TB,共有 240 万商家信息和 5500 万活跃用户在上面活动,每天发表点评超过 80 万条,每日点评浏览量超过 4700 万人次。
用户数据的暴增与数据的社会化在很大程度上模糊了 O2O 电商企业数据的边界,这些由用户创造的海量数据远远超越了目前人力所能处理的范畴。庞大的数据量使得数据过载、数据冗余、数据捕获成本快速增长、数据价值不易获得成为O2O电子商务面临的新问题。 根据相关统计显示,如今世界已经进入到大数据时代,电子商务中用户数据每年增长约 60%,企业平均捕获其中的 25% ~ 30%,但数据的利用一般不足其 5%,用户数据作为O2O电商核心资源的商业价值远未被挖掘。 基于此,本文对“大数据”环境下 O2O 用户数据挖掘以及应用进行了分析。
1大数据环境下O2O电子商务用户数据特征分析相比传统的电子商务数据,O2O 用户数据并不仅仅局限于平台数据,即用户在 O2O 的交易数据,还包括了社交网络、用户移动终端的地理位置等数据。 也就是说,O2O电子商务用户数据为在 O2O 电商日常经营中产生和积累的与用户相关的交易、互动、观测数据。 O2O 用户数据具有大数据的特征。
( 1) 体量大。不少的O2O电商企业每日所产生的用户数据已经达到TB级。 在融入了社交网络和移动互联网的O2O电子商务中,O2O 用户数据已不仅仅是用户交易数据,它拥有更加广泛的数据源,其数据规模会从TB级跃升到PB甚至是EB级。未来企业会将更多的TB级数据应用于商务智能和商务分析。
( 2) 类型多。 O2O 用户数据类型复杂。 它并不仅限于 O2O 用户基本资料、用户消费记录、电商企业内部业务信息等海量的结构化和半结构化数据,还包括用户评论等反馈数据、用户 O2O 平台行为记录、移动终端数据和社交媒体等非结构数据。
( 3) 速率快。 O2O 模式对用户数据实时处理有着极高的要求: 用户数据伴随用户行为产生,这些数据往往是高速实时数据流,例如用户在线下商家的消费情况、用户的地理位置和移动方向等,而且O2O 业务周期短,这需要实时的分析用户数据并根据分析结果对用户进行个性化服务,通过传统的数据库查询方式得到的“当前结果”很可能已经没有价值。
( 4) 价值高。 O2O 用户数据有着巨大的商业价值。用户是 O2O 业务的核心,对用户进行预测分析与深度复杂分析,对 O2O 电商企业无疑有着重大的价值,但庞大而繁杂的不相关用户数据,这也决定了其价值密度低的特性。
2大数据环境下 O2O 电商用户数据挖掘流程与方法2.1 O2O 电商用户数据挖掘框架由于 O2O 电商用户数据的 4V大数据特征,电商企业并不能运用传统数据分析技术对其进行很好的利用。 传统数据分析与大数据挖掘都是从数据中提取有用信息、发现知识,是对数据进行深入分析和增值开发利用的过程,但是它们之间有着本质区别,主要体现在:
1) 两者分析的数据规模不同,传统数据分析处理的通常是存储在数据库或者文件中的数据,数据规模一般是 GB 级以下,而大数据挖掘中的数据规模一般是 PB 级甚至更大量级;
2) 两者分析的数据类型不同,传统数据分析主要针对静态的、结构化的数据,而大数据挖掘的对象不仅仅是结构化数据,还包括半结构化、非结构化数据,很多时候是以实时数据为主;
3) 两者的分析手段与方法也有差别,传统数据分析的主要算法以统计学为基础,分类和预测是两种常见的数据分析形式,主要包括探索性数据分析( EDA) 和验证性数据分析( CDA) ,而大数据挖掘不仅仅需要统计学方法,还大大使用了机器学习、人工智能的算法。应用于传统数据分析的统计学方法主要有:数学运算、快速傅里叶变换、平滑和滤波、基线和峰值分析。 然而这些方法在大数据环境下是很难有效使用的,一方面传统数据分析需要假设检验,即需要在明确的假设前提下分析数据,因而严重依赖于数据分析师及分析过程,若数据分析员不熟悉业务情景或无法准确理解分析目标,传统数据分析工具就难以承担 O2O 电商客户数据挖掘重任; 另一方面传统数据分析只适合结构化数据,难以集成和分析地理数据、视频数据、文本数据等非结构化数据。 另外,传统数据分析实时性差,很难以合理的成本获得可接受的响应时间,直接导致在传统分析过程中投入较高的成本,却不能及时获得管理人员所需要的分析结果。在传统数据分析失效时,如何从大数据量、类型复杂的O2O电商用户数据中及时洞察其中价值,将是 O2O 电商企业竞争的利器。大数据挖掘成为O2O电商用户数据转化为具有价值知识的重要手段,是通过分析海量数据,从数据海洋中寻找其规律的技术。
针对O2O电商用户数据特点,数据挖掘为O2O电商提供更有用的知识,更精确的信息以及更及时的响应。基于此,我们提出了一种O2O电商用户数据挖掘框架,如图 1 所示。
图1.O2O电商用户数据挖掘框架