摘要:在市场化取向改革的背景下,信息采集多样化和质量的重要性尤为突出,在此过程中我们探索直接面向零售客户的线上问卷调查,本文详细阐述了问卷调查过程中统计方法的运用和存在的问题,基于工作实际建立问卷模型、分析模型和应用模型,以期抛砖引玉,让各种模型帮助我们提升工作效率和成效。
关键词:统计;模型;调查问卷;信息采集;数据分析
卷烟市场信息采集是建立现代卷烟营销体系的重要基础性工作。市场信息的采集、分析与利用驱动着需求预测、货源组织、货源供应和品牌培育等营销关键业务的开展,是订单供货的起点、工商协同营销的依据、把握市场的前提。当前宜春市烟草公司建立了“国家局直报信息采集、国家局客户经理每周报送信息采集、省局每月报送重点规格信息采集、省局半月专销结合报送重点规格信息采集”四类相互独立信息采集,多重渠道采集价格和库存,但这四项信息采集都是由一线客户经理采集,只是内容、时间节点、使用途径不经相同。同时,我们虽然从零售客户扫码数据中了解了价格和库存,但由于覆盖面小,代表性有待考量。因此,我们现在急需大规模面向零售客户的信息采集,从而拓宽信息采集来源,增加数据的可靠性。
为了更精确、更广泛开展面向零售客户的信息采集,我们采取了线上问卷形式,通过各种统计方法提高数据的精准度,建立各种模型提升数据分析和应用的实效性。现将统计方法应用和数据建模分享如下,愿大家开展类似工作时可以少走弯路。
1、问卷模型
图1 问卷模型选择思维导图
1.1 问卷效度
问卷的效度指问卷题目的有效性和准确性,即问卷题目是否准确的代表或反映了研究者的研究目的和目标。
要保障问卷有效,就要在问卷内容和频次上下功夫。笔者通过对各种方案进行试验、比对、调研,最终确定问卷模型,具体如下:
一是采集内容选择。
二是采集时间选择。
三是问卷奖励选择。
确定问卷模型后,制作问卷模型模板:
1.2 问卷信度
问卷的信度指问卷资料的可靠性和真实性,即问卷资料是否客观真实的反映问卷对象的情况。
截至2023年5月,该问卷总计发送了166期周问卷。
前七期问卷尚未对问卷信度加以控制,总结前七期,我们发现存在以下问题:第一项许可证编码由于长达12位数字,有些零售客户在填写的时候少一位或多一位数字;第二项库存和销量,有些零售客户填成中文、0填成“O”(字母“哦”)、1填成l(字母“L”)等,每次收集问卷后需经过修正才能够使用;第三项价格,有些零售客户填成了包价。
第八期开始对各项内容在填写环节进行控制,提高问卷的信度。一是要求许可证编码必须为12位数字,否则提交不了。通过此项设置,由前期收集问卷的6.1%编码不符下降至2.5%。二是要求客户所填必须为数字,否则提交不了。通过此项设置,由前期9.5%的中文等错误项直接降至0%。三是要求客户所填价格必须在合理区间范围,否则提交不了。通过此项设置,由前期24.5%的价格不符合降至0%。
2、分析模型
2.1 可靠性控制
问卷分析环节的可靠性,需要把一些明显逻辑错误的数据剔除,从而保障整体数据能够反映市场最真实的状况。
一是“整体大或等于局部”。由问卷可知,我们要采集重点规格的库存和销售(共采集了15个规格,未一一列出),其中有一项为总体库存和销售,通过总体库存、各规格库存之和,两个数字的对比,可以把不符合整体大于局部的数据剔除掉,同理销售数据的剔除。
二是“15个主销规格库存之和占总库存的比重大或等于50%”。由于采集的这些规格为我市的主销规格,占全市销量的80%多,而各零售客户所处商圈有差异,适当把这个占比放宽至50%,可以剔除掉总量严重失真的数据。
目前库存逻辑符合率保持在70%左右、销售逻辑符合率保持在60%左右,仍旧存在部分客户随意填报、数据失真的情况。
2.2 数据还原
目前收集的有效问卷数占全市客户数的40%,样本量远远高于占全市客户2.5%客户经理采集的样本客户和占全市客户10%左右的扫码销售客户,从这个角度来说,问卷数据更为贴近市场真实情况,而如何还原、保障数据不失真,需要我们不断摸索。
数据的还原需要贴近数据应用场景,信息采集的价格与库存主要是为了了解市场状态,为货源投放调控提供数据支撑,因此选定数据还原方式时,充分考虑了可以实施的营销策略投放渠道,从而分类进行数据还原。
由于具体货源投放时大部分为按档位投放,目前主要采取的还原方法为档位还原。全市2万零售客户根据销量和销售额划分为30个档位,将问卷调查的客户按照档位归类,再按照如下公式还原:
由此撰写每周问卷调查分析报告,并根据库存、可销天数、价格等数据进行货源调控,保障卷烟市场状态向好。
3、应用模型
3.1 周分析应用
每周还原出各规格、各档位、各规模、各区域类型、各分公司价格和库存具体数据,并形成分析报告,通过各周期数据比对,确定调控规格和调控目标,从而调整营销策略。
每周分析通过各分公司数据比对,确定各分公司的脱销重点关注规格和滞销的重点关注规格,以数据支撑客户服务。
3.2 年分析应用
3.2.1 基期指数分析
以第一期数值作为基期,赋值为1,其他期值除以基期值得到该期值,通过指数分析,能够更好的把握各项指标的波动趋势。以某年分析为例:
公司销量波动大、社会销量提升并稳定在一定区间、社会库存持续走低、价格稳步提升。
图2 社会库存指数、社会销量指数、公司销量指数、价格指数、测算社会库存指数对比分析图
由上图不难发现,绿色三角形折线代表的公司销量波动剧烈,说明整体货源投放不够均衡。
深蓝色菱形折线代表的社会库存和浅蓝色*形折线代表的测算社会库存整体趋势一致,差距不大,说明问卷调查还原出来的库存有一定的参考意义,偏差率较小,在可控范围内。
紫色×形折线代表的价格指数(将采集的各规格价格按照1-11月相应规格销售占比为权重计算价格指数),整体呈现上扬态势,与库存走低正好背向趋势,但价格波动的幅度不大,这也与价格本身具有一定的稳定性有关,不会因为库存为过去的一半,而价格为过去的一倍,并不具备等比例逆相关。
3.2.2 绝对值分析
以每期具体值进行绝对值趋势分析,部分分析可分两列纵轴,便于对价格、库存两类数据进行关联分析,其中某期总价格公式如下:
以某年分析为例:
示例一:价格与库存逆相关。
注:左纵轴单位为箱,右纵轴单位为元/条。
图3 社会库存、价格指数对比分析图
左边的纵坐标代表社会库存的值,右边的纵坐标代表价格的值。
示例二:节后量价齐升,需求回暖。
注:左纵轴单位为箱,右纵轴单位为元/条。
图4 社会销量、公司销量、价格指数对比分析图
左边的纵坐标代表社会销量和公司销量的值,右边的纵坐标代表价格的值。
示例三:整体库存多时,城区镇区乡村依次库存降序,整体库存少时,区域类型库存差异不明显。
图5 各区域类型可销天数波动情况图
3.2.3 社会销售与公司销售偏差率分析
采用公式“(社会销售-公司销售)/公司销售*100%”,可进一步验证各分公司数据是否偏差较大,也可以分析出某段时间内该单位是在增加库存还是在消化库存,与市场走访了解的情况进行互相验证。以某年分析为例:
樟树和高安数据出现偏差,须进一步调研失真还是外流。
注:偏差率=(社会销售-公司销售)/公司销售*100%
图6 各分公司社会销售与公司销售偏差率波动情况图
绿色三角形折线代表的樟树社会销售与公司销售的偏差率在150%,也就是社会销售是公司销售的2.5倍,远远大于其他分公司,而樟树的库存可销天数一直处于全市高位,说明社会销售大于公司销售并没有多少转化为社会库存的降低,而抽查和走访调研里,樟树并未呈现出周末与平时之差比其他分公司更为突出的情况,后期须进一步调研是否存在樟树零售客户上报的数据严重失真,是否存在外流现象。
紫色×形折线代表的高安社会销售与公司销售基本一致,但库存却在持续走低,后期须进一步调研是否存在高安零售客户上报的数据略微失真,是否存在外流现象。
其他分公司的偏差率在50%左右,与全市保持统一态势,且集中度较高,说明在社会销售和公司销售的关系上保持了较为明显的一致性。
4、总结
应用统计分析方法的效度和信度能够有效提升问卷的有效性和及时性;应用统计分析方法的可靠性控制和数据还原能够将采集到的单体信息汇总成总体数据;应用统计分析方法的基期指数分析、绝对值分析和偏差率分析,能够较好的反映出市场整体波动趋势和挖掘各项数据的相关性,为卷烟调控提供有力数据支撑。通过各种统计分析方法的应用,建立了问卷模型、分析模型和应用模型,在应用模型中的各项数据分析,反向又印证了问卷模型和分析模型的有效性,从而形成了“采集-分析-应用”的完整闭环,而应用的结果又可以通过下一期的“采集-分析-应用”进行成效验证,并不断实时调整应用的幅度,达成稳定的市场状态。
通过低成本的问卷和便捷的线上采集,将信息采集面提升至40%,从三大环节的互相印证,证明了三大模型的有效性,此次模型的建立既实现了覆盖面提升,又实现了模型时效性与有效性保障,搭建了较为完善的问卷式零售客户信息采集模型。
参考文献:
李方.论教育调查问卷资料的统计分析[J]. 华南师范大学学报(社会科学版),1993.1:103-110.
重庆中烟,以新质生产力推动企业高质量发展