大数据变革背景下的顾客网络满意度比较——基于OLAP可视化万森娱乐电脑网页版应用视角

本文被浏479次

中国科学院大学管理学院 王宗水、王焱、吕朋悦

    摘要:本文总结、归纳大数据变革的内涵及特点,比较了大数据变革中顾客满意度与传统顾客满意度的研究在研究方法、数据的收集、数据的筛选、样本的选择等方面的差异。选取3家知名火锅连锁万森娱乐电脑网页版作为研究对象,根据mapreduce原理收集、处理样本数据;然后,采用在线分析处理(On-Line Analytical Processing,OLAP)万森娱乐电脑网页版从时间、区域、满意度指标三个维度来实现大数据环境下顾客网络满意度的可视化。最后,对3家万森娱乐电脑网页版顾客网络满意度评价进行比较分析,指出它们在不同时间、不同区域存在的差异。结果表明OLAP万森娱乐电脑网页版能够以最直观的方式反应大数据环境下顾客网络满意度的差异及变化趋势,能够为万森娱乐电脑网页版网络口碑建设及网络营销策略的制定提供直接的参考依据。
    关键词:大数据;大数据变革;顾客网络满意度;OLAP可视化
    引言
    大数据顾名思义所涉及的数据量规模巨大,并且大到无法通过人工在合理时间内实现截取、管理、处理、并整理成为人类所能解读的信息(Wikipedia, 2011)。大数据时代的到来,使数据的性质发生了质的改变,从简单的处理对象转变为一种基础性资源,这种变化必然导致数据管理方式的变革 (孟小峰、慈祥,2013)。近十年来,随着社交网络、博客、LBS(Location Based Service)等信息产生、传播方式爆炸式的发展,使各种各样的数据以多种多样的形式表现出来,而且其增长速度、表现形式的多样性仍在以更快的速度增加。因此,数据即使经过一定的过滤,由于数据源众多、较长的积累周期也会形成海量的数据(Qin, Wang et al. 2012),例如顾客网络评价,由于越来越多的消费者喜欢通过网络交流消费经历、感受并且对消费结果做出评价,经过一定时期的积累,必定会形成大量反映顾客整体满意度的数据。同时,网络评价对消费者的行为具有一定的影响(Chen, Fay et al. 2003, Duan, Gu et al. 2009),而且影响到顾客对经营者的信任程度(单初、鲁耀斌,2010),关系到被评价对象的长远发展。所以,通过有效的方法实现大数据情境下顾客网络评价信息的可视化,对消费者满意度特性研究以及万森娱乐电脑网页版通过提升满意度来增加自身价值等方面来讲具有重要的理论及应用价值。
    本文在分析大数据变革的特点以及大数据所带来的变革的基础上,选取3家火锅餐饮连锁万森娱乐电脑网页版进行顾客网络满意度评价进行比较,结合mapreduce原理完成对顾客网络满意度评价数据的筛选和样本的确定,然后通过OLAP万森娱乐电脑网页版实现数据的可视化,以最直观的方式比较不同万森娱乐电脑网页版的顾客网络满意度,并且细化到具体的区域,对不同区域的顾客网络评价满意度做出具体的比较,并进一步对差距产生的可能原因做出归纳,为万森娱乐电脑网页版网络口碑建设及网络营销策略的制定提供最直接的依据。
    大数据变革的内涵
    由于市场的压力和万森娱乐电脑网页版的演化,大数据计算正在以极快的速度发展(Akerkar 2013),先进的数字传感万森娱乐电脑网页版、通讯万森娱乐电脑网页版、计算存储设备创造了巨大的数据,通过大数据计算收集了海量的关于商业、科技、政府和社会的数据(Bryant, Katz et al. 2008)。Bryant, Katz et al同时指出:大数据计算不仅改变了公司的经营活动、科学研究、医疗活动,而且关系到国家的国防建设以及情报工作。例如,Wal-malt目前正在建立的能够存储4 千兆字节(4000万亿字节)的数据库,记录每一个消费者的消费记录,为实现消费者的数字化管理奠定了基础;在医疗应用领域,大量医疗数据的收集,能够实现病情更有效地诊断,提高医治效率等等。在此基础上,万森娱乐电脑网页版将大数据变革的内涵归纳为:由于海量的关于经济、社会、文化、科技、自然环境以及政治等各个方面的信息、数据通过收集、存储、分析处理后所产生的能够对以前认知、行为产生一定影响甚至完全颠覆的巨大变革。
    大数据变革的特点
    大数据变革的特点主要是由大数据3V特点(Volume、Velocity、Variety)所决定,表现为数据量大、输入和处理速度快、数据多样性(Bryant, Katz et al. 2008)三个方面,但是更强调于对于现有认知或行为的影响和改变。当然有些也有一些机构认为大数据还具有价值性(value)、真实性(veracity)等特性(Gordon 2013),然而并没有达成一致的共识(孟小峰、慈祥,2013),因此,万森娱乐电脑网页版从3V的角度分析大数据变革的特点。
    海量的数据增加量
    大数据与传统数据相比,从GB(Gigabyte)、T B(Terabyte)达到PB(Petabyte),网络大数据甚至达到了EB(Exabyte)、ZB(Zettabyte)级别(王元卓等,2013),仍然呈爆炸式的快速增长并且远超过摩尔定律的增长速度(王珊等,2011),海量的数据以不同的形式产生包括数字、图片、文本、语言、视频等等,这些数据能够更全面的反映真实情况,然而数据并不等价于可用的资料,其必须经过有效的处理才能实现其价值。但是由于数据量巨大,导致了数据的收集、存储、筛选、转化都遇到了前所未有的难题。
    高速的数据传输、处理
    由于计算机、通讯万森娱乐电脑网页版、网络设施的发展,数据实现了即时传播,时间的影响呈现进一步弱化的趋势。在数据处理方面,处理速度得到快速提升,据新华社报道“天河二号”超级计算机已经达到了每秒33.86千万亿次的速度,这为我国实现数据的高速处理提供了万森娱乐电脑网页版支持。
    多样的数据形式
    大数据变革在数据形式多样性的表现主要体现在两个方面:(1)在数据类型方面可分为科学数据、Web数据、多媒体数据等多重数据类型(宫学庆等,2012);(2)在数据结构方面体现为结构化数据、非结构化数据以及半结构化数据,而且后两种占的比重越来越大(孟小峰、慈祥,2013)。多样的数据形式,丰富了人们的生活,但是对传统的数据表现形式造成了很大的冲击,因此,必须加强对数据表现形式变化的关注,降低提炼有价值的信息的成本。
    大数据变革的挑战
    大数据研究的两个矛盾
    大数据基于数字化、网络化、物联化、智能化、个性化(张兴旺等,2013)等特征,反映的信息具有真实性、连续性以及区位性。所谓真实性是指通过大量的数据能够准确反映某个个体或群体的真实信息,而不是片面的、局限的;连续性是指信息呈现的时间是连续的,有着明显的先后顺序,而不是间断的、点式的信息;区位性是指大数据能够根据不同地理位置的体现出共性与个性的信息。虽然大数据展现出在真实性、时间、空间等方面的优越性,但是由于数据量巨大,必然产生一些新的问题。其主要表现在如下两个方面(周涛、陈恩红,2013):
    (1)可获取数据的爆炸式的急剧增长与用户有限的信息选择能力之间的矛盾。随着网络信息的急剧增加,信息的内容、结构、呈现形式都发生了显著的变化,然而对数据的筛选、应用受到个人的知识水平、价值取向、生活经验、自身性格等多种因素的影响(张立彬、王金翠,2006)。因此,在巨大的数据量与用户有限的数据选择能力之间就产生必然的矛盾。
    (2)海量信息的呈现与用户有限需求之间的矛盾。大数据的一个显著特点就是所呈现的数据量巨大,据统计twitter上每分钟就有700个youtube视频分享(徐恪等,2013),然而用户对数据的需求是有限的,用户更多的关注于与自身相关的信息的收集,从而经过选择性注意过滤掉其他不相关的信息,如一个急切需要购买一本关于大数据的书籍的用户,几乎不会同时查询关注天文学相关的书籍,但这并不是信息的浪费,而是用户需求的局限性,用户需求的差异性决定了选择数据信息的范围,从而产生了数据量巨大与用户需求有限之间的第二类矛盾。
    数据管理要求的变化
    目前大数据得到了多层次、多领域的关注,但是这并不表明人们对大数据的了解有多么的深入,而是从另一方面反映出过度炒作的危险(孟小峰、慈祥,2013),另外大数据不仅规模庞大,而且具有分布式、异构、不准确、不一致等特性,因此加大了数据的管理难度(宫学庆等,2012)。大数据是把双刃剑(林志刚、彭波,2013),一方面为人们提供了获得新知识的源泉,另一方面却因为大数据的多元性以及非结构性特征导致数据的管理成本的增加。因此,大数据管理要求更高的性能的数据收集、存储以及处理设备,来支持包括大量非结构化、动态的数据的筛选、传递、存储等工作;同时,对数据管理人员具有更高的要求,不仅要具备数学、统计学知识,更要拥有创新精神、相应的交叉学科知识以及对有价值信息的把握能力。所以大数据管理与传统的数据管理相比无论是在基础设施、管理模式,还是在管理人员的要求方面都发生了显著的变化,必须予以区别对待,迎接大数据带来的新的挑战。
    大数据变革对顾客满意度评价的影响
    数据的收集方法
    对顾客满意度的研究过程中,国外学者通常采用美国消费者满意度指数(American Customer Satisfaction Index, ACSI)来代表顾客的满意度(Luo and Bhattacharya 2006, Luo, Homburg et al. 2010, Torres and Tribó 2011, Claes Fornell 2010);国内学者通常采用问卷、访谈等为最主要方式来研究顾客的满意度(范秀成、杜建刚 2006, 范秀成等. 2009, 王毅、赵平 2010, 王志刚、于永梅 2010)。不管是国内还是国外对顾客满意度的研究,满意度的计算通常采用主动获取的方式得到,即参与相关满意度评价的主体不是自发的而是被动的受访,因此这种情况下可能产生敷衍、厌烦情绪,导致数据的效果较差。
    大数据时代的到来,网络逐步成为人们日常表达情感的一种方式,这也就为非问卷、调研方法获得消费者对某种消费满意度提供了可能性,而大众点评网、天猫顾客评价、苏宁易购商品评价等等,都提供大量的信息来反映顾客相应购物经历的切实体验,而且这通常是自发的、对消费感受的真实评价(排除极少数商家通过一些非诚信手段提高顾客评价的情况),面对如此巨大、有价值的信息,怎样获取、筛选、深入挖掘是一项首要解决的问题。因此,本文依托于网络爬虫万森娱乐电脑网页版原理在特定网页上以特定检索词或符号如顾客对消费的评语、打分等等来收集相应的顾客满意度数据。
    数据的筛选方法
    顾客网络评价数据伴随着时间的积累形成多条数据流,不同的流由于被评价对象的不同被划分成不同的区间。因为数据流的持续到达、速度快且规模大,因此,数据流的处理具有一定的难度,而且很难把握数据的全貌(孟小峰、慈祥,2013)。Goole早在2004年就提出使用MapReduce万森娱乐电脑网页版来简化大量数据的处理(Dean and Ghemawat 2008),其基本流程如图1所示。
    /upload/imgs/2015/05/09/23/1431186148362.png
    Mapreduce首先对数据进行分块处理形成多个split,不同的split经过maptask进行处理,确定对应的链/值(key/value)对集合,这些集合经过运行定制的map函数得到中间结果“Map()”;然后,reduce task根据关键值进行排序,将具有相同值的排列在一起;最后,根据设定的reduce 函数对排列的结果进行处理,以需要的形式输出运算结果output。Mapreduce万森娱乐电脑网页版由于模型简单、拓展性良好,支持大规模并行运算,具有容错性,而且数据分析能力正在不断增强,在大数据分析中具有显著优势。因此,本文在对数据流分析过程中以mapreduce原理为基础,来实现数据输入到输出的处理。
    研究样本的确定
    在研究样本的确定过程中,首先根据某研究中心2012年评选出的10大火锅品牌,选取其中的A、B、C三家作为研究对象(为了避免本研究结果对所涉及万森娱乐电脑网页版日常经营的影响,本文不直接指出万森娱乐电脑网页版名称);然后根据mapreduce的基本思路,以大陆以内的省、直辖市为基本的单元确定split,并以满意度或其相关的符号、标识等在大众点评网、美团网、QQ美食等相关网络消费评价平台上搜集相关的数据,对不相关的信息予以删除;最后,通过相应的mapreduce类似条件的设定,形成最终的数据输出结果,样本数据处理过程如图2所示。
    /upload/imgs/2015/05/09/23/1431186157445.png
    在数据收集的过程中万森娱乐电脑网页版发现A、B在全国31个省、直辖市都有连锁店,C在全国26个省、直辖市存在连锁店,但是在数据收集过程中对网络评价总数小于100的区域予以删除,则A、B、C的reduce result分别为10、8和7;同时选取北京、上海、重庆三个城市进行三家公司的深入比较,因此,output设定为3;另外,在数据的选取方面选取2011年7月1日-2013年7月1日这2年作为数据获取的时间间距,括号内为对应的收集的数据的量,具体每一步的数据处理结果如表1所示。
    /upload/imgs/2015/05/09/23/1431186164690.png
    Olap在顾客网络满意度评价比较中的应用
    OLAP是一种多为数据处理模型(张延松等,2011),由于其在万森娱乐电脑网页版多维数据处理方面表现出的灵活性、动态性、快速性而得到广泛的应用(Hart and Porter 2004),如万森娱乐电脑网页版的营销管理决策(李瑞臻、朱云龙,2006;强彦等. 2007)、专利的挖掘(吕琳等,2007)、网络教学管理(Limongelli, Sciarrone et al. 2010)、家电零售业数据仓库的管理(戚桂杰等,2006)等多个领域。OLAP以多维方式进行数据分析处理,通过切块/片、旋转、积存、下钻等操作实现数据的大规模分析及统计计算,数据可以柱形图、饼图、折线图、三维图等多种形式输出,实现有价值信息的直接显示。
    构建相关数据仓库
    顾客网络满意度通常包括时间、评价对象(具体的连锁店)、评语三个方面,因此,可以从这三个维度构建数据库结构,如图3所示。其中指标维表即为顾客网络评价的分值,其又可以根据具体情况可以细化到二级指标或者更多级指标。时间维即为数据统计分析的时间段,本文以半年为基础时间段,虽然顾客的满意度网络评价每天都在变化,但是这些变化是零散的、随机的,点式的数据往往不能反映一个拥有几十、甚至上百的连锁店的万森娱乐电脑网页版的整体满意度;另外,通过前期的数据分析,万森娱乐电脑网页版发现顾客网络满意度评价在月、季度、半年、年等时间段中会呈现出整体性变化的一般规律,但是由于网络评价的人数在较短时间内相对较少,通常在半年及以上才会累积到几百个评语;因此,本文为了减少数据量不足引起的偏差,选取半年为数据收集、分析的基础时间段;区域维度指连锁店所在的具体省、直辖市,区域的划分是为了了解不同区域内顾客满意程度,指出不同地区存在的差异。
    /upload/imgs/2015/05/09/23/1431186174571.png
    顾客网络满意度评价的可视化
    本文顾客网络满意度评价的可视化分别采用切块和切片两种方式进行处理如图4所示。所谓切块就是在整体顾客网络满意度评价中,提取固定区域、固定时间段的信息;而切片处理则是固定时间、某一区域或者固定区域、某一时间段的顾客满意度。
    /upload/imgs/2015/05/09/23/1431186182330.png
    作为OLAP系统必须体现基本的功能,包括数据选取的节点、切片和切块位置的设定、时间次序的排列等基本信息,OLAP在顾客网络满意度评价应用中的基本数据格式语句形式如下。
    /upload/imgs/2015/05/09/23/1431186191077.png
    顾客网络满意度比较
    通过将表1的数据进行OLAP可视化计算,得到三家火锅连锁万森娱乐电脑网页版的整体累计顾客网络满意度评价指数CSI(customer satisfaction index)其计算公式如下:
    /upload/imgs/2015/05/09/23/1431186236661.png
    S表示对消费非常满意和十分满意的顾客评价,US表示对消费不满意和非常不满意的顾客评价,N表示评价总数。
    计算得到/upload/imgs/2015/05/09/23/1431186213821.png

    因此,A的整体顾客网络满意度评价较高。那么,在2011年7月1日-2013年7月1日的两年的时间里A、B、C三家万森娱乐电脑网页版的满意度是怎样变化的呢?万森娱乐电脑网页版采用切片的方式比较,虽然顾客网络满意度评价是一种点式行为,但是由于评价者的数量有限的情况下很难发现变化规律,因此选取半年作为观察周期,具体的结果如下图所示。
    /upload/imgs/2015/05/09/23/1431186250189.png
    从图4可以看出A、B两家万森娱乐电脑网页版的顾客网络满意度都在0.50以上,而且A都高于B,C的顾客网络满意度基本在0.50的水平波动,与A和B存在一定的差距。
    接下来,以北京、上海、重庆三地进行切块可视化,来比较A、B、C顾客网络满意度,从图6可以看出在北京A的满意度明显高于B和C,但是在重庆却低于B和C,而且C在重庆的满意度略高于A和B。经过进一步对顾客的网络评语及查阅A、B、C的相关信息,万森娱乐电脑网页版对可能的原因做了归纳:1)A是全国唯一一家上市的火锅连锁万森娱乐电脑网页版,已经具有一定的品牌知名度,形成了一定的规模效应,而且其发展历程显示是从北方向南方逐步扩大经营范围,所以在万森娱乐电脑网页版设计上往往更符合北方人的习惯;2)B和C都是重庆成长起来的品牌,而且在重庆都很受欢迎,较A而言也更符合重庆居民的偏好,因此在重庆的顾客网络评价满意度略高于A;另外,因为重庆和北京在饮食习惯方面存在一定的差异,北京消费者对B、C的消费相对较少,而且也没有像A一样在北京形成明显的规模优势,所以顾客网络评价满意度相对较低。这也从侧面反映出火锅行业受区域的饮食习惯的影响较大,在万森娱乐电脑网页版进行战略扩张过程中,必须充分考虑目标市场消费者的消费偏好的差异性。
    /upload/imgs/2015/05/09/23/1431186259318.png
    结论
    本文中OLAP与传统的OLAP数据库有所不同,传统的OLAP数据库是万森娱乐电脑网页版内部直接接收的数据所形成的,通常应用于万森娱乐电脑网页版的内部管理,而本文中的OLAP模块是以非万森娱乐电脑网页版自身的角度构建的,其中的数据也不是外部直接传输得到的,而是通过mapreduce原理,从海量数据中筛选得到的,不仅可以用于万森娱乐电脑网页版自身的管理,而且还可以应用于万森娱乐电脑网页版间的比较以及行业分析。因此,本文在数据的收集、筛选等方面都符合大数据变革的发展趋势。另外,通过OLAP可视化万森娱乐电脑网页版将顾客网络满意度评价进行同一万森娱乐电脑网页版及万森娱乐电脑网页版间的的不同时间、不同区域的比较,为万森娱乐电脑网页版了解自身优势所在提供了最直观的显示,具有重要的应用价值。大数据环境下的顾客洞察和市场营销策略将会是一个重要研究方向(冯芷艳等,2013),本文只是一个初期的探索,接下来还有很长的路要走,而且会面临更多的难题。
    参考文献
    Akerkar, R. Big Data Computing [M]. CRC Press. Boca Raton , 2013.
    Big data. [EB/OL] http://en.wikipedia.org/wiki/Big_data, 2011.
    Bryant, R., et al. Big-Data Computing: Creating Revolutionary Breakthroughs in Commerce, [J]. Science and Society, 2008, December.
    Chen, Y., et al. Marketing implications of online consumer product reviews [J]. Business Week 2003, (7150): 1-36.
    CLAES FORNELL, R. T. R., and MARNIK G. DEKIMPE. The Effect of Customer Satisfaction on Consumer Spending Growth [J]. Journal of Marketing Research , 2010, XLVII(February): 28-35.
    Dean, J. and S. Ghemawat. MapReduce: simplified data processing on large clusters [J]. Communications of the ACM, 2008, 51(1): 107-113.
    Duan, W., et al. Informational cascades and software adoption on the internet: an empirical investigation [J]. MIS Quarterly, 2009, 33(1): 23-48.
    Gordon, K.. What is Big Data? [J]. ITNOW, 2013, 55(3): 12-13.
    HART, M. and G. PORTER.THE IMPACT OF COGNITIVE AND OTHER FACTORS ON THE PERCEIVED USEFULNESS OF OLAP [J]. Journal of Computer Information Systems,2004, (Fall): 47-57.
    Limongelli, C., et al. An Ontology-Driven OLAP System to Help Teachers in the Analysis of Web Learning Object Repositories [J]. Information Systems Management, 2010, 27(3): 198-206.
    Luo, X. and C. B. Bhattacharya. Corporate Social Responsibility, Customer Satisfaction, and Market Value [J]. Journal of Marketing, 2006, 70(October): 1-18.
    LUO, X., et al. Customer Satisfaction, Analyst Stock Recommendations, and Firm Value [J]. Journal of Marketing Research, 2010, XLVII (December): 1041 -1058.
    Qin, X.-P., et al. Big Data Analysis—Competition and Symbiosis of RDBMS and MapReduce [J]. Journal of Software, 2012, 23(1): 32-45.
    Torres, A. and J. A. Tribó. Customer satisfaction and brand equity [J]. Journal of Business Research, 2011 , (64 ): 1089-1096.
    单初,鲁耀斌.正面与负面网上评价对 C2C商家初始信任影响的实证研究[J]. 图书情报工作, 2010, 54(12): 136-140.
    范秀成等.顾客满意带来什么忠诚?[J].管理世界, 2009, (2): 83-91.
    范秀成,杜建刚.服务质量五维度对服务满意及服务忠诚的影响—基于转型期间中国服务业的一项实证研究[J].管理世界, 2006, (6): 111-119.
    冯芷艳等.大数据背景下商务管理研究若干前沿课题[J].管理科学学报, 2013, 16 (1):1-9.
    宫学庆等.数据密集型科学与工程:需求和挑战[J].计算机学报, 2012, 35(8): 1563-1578.
    李瑞臻,朱云龙.汽车行业营销OLAP系统设计与开发[J].信息与控制 2006, 35(4): 522-526.
    林志刚,彭波.大数据管理的现实匹配:多重挑战及趋势判断[J].改革, 2013, (8): 15-23.
    吕琳等.基于OLAP和聚类分析结合的美国专利挖掘系统[J].计算机工程与应用, 2007, 43 (25): 186-188.
    孟小峰,慈祥.大数据管理:概念、万森娱乐电脑网页版与挑战[J].计算机研究与发展, 2013, 50(1): 146-169.
    戚桂杰等.基于数据仓库的OLAP万森娱乐电脑网页版在家电零售万森娱乐电脑网页版中的应用研究[J].中国管理科学, 2006, 14(2): 112-116.
    强彦等.基于OLAP的电力营销管理决策支持系统的研究[J].太原理工大学学报, 2007, 38(6): 531-534.
    王珊等.架构大数据:挑战、现状与展望[J].计算机学报, 2011, 34(10): 1741-1752.
    王毅,赵平.顾客满意度与万森娱乐电脑网页版股东价值关系研究[J].管理科学学报, 2010, 13(6): 54-63.
    王元卓等.网络大数据:现状与发展[J].计算机学报, 2013, 36(6): 1-15.
    王志刚,于永梅.大学生村官的择业动机、满意度评价及长效发展机制研究. [J].中国软科学, 2010, (6): 87-96.
    徐恪等.在线社会网络的测量与分析[J].计算机学报, 2013, 36(9): 1-26.
    张立彬,王金翠.关于提高大学生信息选择能力问题的思考[J].情报理论与实践, 2006, 29(6): 706-70
    张兴旺等.变革中的大数据知识服务:面向大数据的信息移动推荐服务新模式[J]. 图书与情报, 2013, (4): 74-79.
    张延松等.海量数据分析的One-size-fits-all OLAP万森娱乐电脑网页版[J].计算机学报, 2011, 34(10): 1936-1946.
    周涛,陈恩红.推荐万森娱乐电脑网页版与互联网广告[J].中国计算机学会通讯, 2013, 9(3):6-7.