形成各类商业、政企及民生的数据分析报告

2020-06-21 20:52

说起大数据,估计大家都觉得很熟悉,但是具体是怎么定义,怎样应用,却没有很清晰的概念。在我们的印象中,很多公司都叫大数据公司,业务形态则有几百种。大数据到底是什么?在各行各业中如何应用?

通过以上事例,可以充分显示出大数据分析的价值和在现实中应用的效果。

一个是多样性——如果只有单一的个人数据,或者单一的用户提交数据,这些数据还不能称为大数据。比如特定时段上网用户年龄,学历,爱好,性格等等每个人的特征汇总,即可呈现了大数据的多样性,如果扩展到全国,那么数据的多样性会更强。

在采用传统做法对用户进行分析时,多采用老客新客、男客女客等维度进行分析;而通过大数据,则可以运用机器学习和组内平方误差和wss来找到最佳的分类方式,根据这家店铺的数据进行处理分析后得到,最佳的聚类数目为4类。(从4类客户扩展到5类及5类后客户,曲线斜度已变小,失去客户拓展价值。)

一个是速度快——通过算法对数据的逻辑处理速度非常快,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。

而根据rfm聚类(识别客户价值,应用最广泛的客户细分模型是通过三个指标:最近消费时间间隔recency、消费频率frequency、消费金额monetary进行聚类。)和k-means算法聚类(采用欧式距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。)分析,则直观地显示出四类客户的价值区块,帮助店铺进行客户价值区分。(蓝色区域为最具有价值的客户。)

在进行促销时,传统做法往往根据销量,对销量较好的产品进行折扣促销,以便吸引更多客户,提升营业额,比如单独对拿铁单品进行促销。而根据大数据基于apriori算法的商品关联规则挖掘,可得到,这家店铺如果以澳洲小白咖啡和原味千层蛋糕组合进行促销,可以得到最佳销售效果。

以上是由11fl公众号(微信搜索11fl或在文章结尾扫码即可关注)的数据科学家们应用大数据分析的真实应用案例。他们运用大数据技术对数据进行分析处理,形成各类商业、政企及民生的数据分析报告,涉及各行业多角度、多维度、多层面的数据分析。

一个是数量大——只有数据体量达到了pb级别以上,才能被称为大数据。

维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》提到了大数据的4个特征:

一个是价值大——你如果有1pb以上的全国所有20-35年轻人的上网数据的时候,那么它自然就有了商业价值,比如通过分析这些数据,我们就知道这些人的爱好,进而指导产品的发展方向等等。