华盖资本张亮韬 | 深度消费:111个品类 * 23个维度,大数据挖掘揭示如何成为大品牌

摘要: 大品牌养成记。

11-11 11:40 首页 华盖资本


本文用大数据挖掘的方法,通过111个品类的23个数据维度,尝试构建一个“品类”出现“大独立品牌机会”的思考决策框架。我们将得到不少有意思的结论,比如:


?  广告推广是影响最大、显著性最高的参数,没有恰当广告策略、没有大量有效广告覆盖,几乎很难成为品牌


?  在广告的基础之上,信任难度大、产品化程度高、供应链成熟的品类,出现品牌的机会更多


?   …


华盖资本TMT基金副总裁张亮韬


数据准备


为了尽量避免特征选取过程中的主观偏见和逆向选择,我从产业结构、产业特点、产品和需求属性、核心能力和竞争策略这5个角度选择了23个最基础的特征维度,具体名字和解释如下表所示。其中“是否有独立大品牌”是我们本次研究的目标特征。


表1 特征维度选择


基于表1,我们就可以对111个细分品类进行标注,最终形成如下图的111*24的大表。


表2 品类及特征数据



分析方法


下图是两个模型对数据进行5次交叉验证的结果(80%的数据训练模型,20%的数据进行验证,共5次)。相对于随机方法50%的正确率,线性回归平均正确率87%,随机森林平均正确率75%,可见本文的特征选择确实有助于我们提高判断能力,品牌的出现也并非无迹可寻。


图1 算法分类准确度(5次交叉验证)



算法结果及特征分析


? 3.1 线性回归


我们使用Stata对数据进行了线性回归分析,得到结果如图2所示。


图2 线性回归结果及各参数相关性


我们重点关注置信度大于90%(P>|t|小于10%)的参数:

   大规模广告(正相关)广告是相关度最高、显著水平最高的参数,当然这里说的广告并不局限于传统广告,也包括社交网络等数字营销。这一点有些出乎意料,但似乎又是最容易被忽略的一个事实:再好的产品也需要让用户知道、需要教育用户、需要触及用户。


   供应链成熟程度(正相关)供应链越成熟,出现品牌的机会越大。最典型的例子是家具,设备和信息化技术的进步大幅提高了家具定制化生产的效率,从而在极度分散的家具市场中产生了尚品宅配、索菲亚等优秀企业。可以预见这个市场的集中度还会进一步提高。同样的,随着供应链的不断成熟,手机、冰箱、洗衣机、电视机等行业的集中度已经得到了极大的提高。当然,供应链的成熟是一个与品牌成长相辅相成的过程,但这为我们寻找1到100的投资时点提供了线索。


   强供应链/强品质/强服务(正相关)都是为了用户价值,建立情感连接。这个特征其实囊括了本次研究并未具体提出的品牌定位等。


   信任成本(正相关)信任成本越高的品类,越有机会产生大品牌。比如汽车、家电、手机、奶粉等,建立信任的门槛高,也因此容易形成门槛。


   产品化程度(正相关)越能够贴近用户最终需求的产品,越容易形成品牌。比如食材很难形成大品牌,除了供应链的原因之外,还在于用户最终端的需求是方便的迟到安全健康美味的食品。反之我们看到方便面、火腿肠、速冻汤圆等品类由于能够满足用户随时果腹的需求,都产生了大品牌。从这一点看,国内即烹美食会有很大的品牌机会。


   历史传承、配方、IP(正相关)这是历史和文化的沉淀,是品牌简历的重要因素。


   所属上级行业是否有巨型公司(负相关)同行业的巨头公司,不利于该行业细分市场独立品牌的出现,除非你又不一样的供应链(这一点下一节可以看到),比如电商、奶制品、零食行业等。


   上游资源优势(负相关):需要上游资源优势的品类往往比较难在市场化的竞争环境下规模化,所以是显著性最高的负相关参数。


其它参数虽然没有足够高的显著性,但由于特征之间并非完全正交独立,可能导致其特征权重被叠加到其它特征之上。比如我们剔除大规模广告特征后再做一次线性回归,“资本进入门槛/固定资产投入”的要重要性就凸显出来了。


图3 剔除广告特征后的线性回归结果


?  3.2 随机森林


通过线性回归算法我们可以看到单一特征的重要性,那么通过随机森林构建决策树,我们可以看到不同特征参数之间的关系与互动。图4是算法的结果。


图4 随机森林算法结果


在决策树中,越上游的节点,包含信息量越大(对应格子中gini系数越大),比如特征“大规模广告”是所有特征中信息量最大的。根据样本是否满足这个特征(比如“大规模广告<0.5”),样本被分成左右两个子集,基于同样的过程,这两个子集会分别被信息含量最高(或者分类效果最好的)特征(比如左侧子集的“强供应链/强品质/强服务”和右侧子集的“信任成本”)的进行分类。这个分类过程将一直持续下去,直到最终的叶子节点只包含同一种类的样本,那么就形成图4所示的决策树。


? 我们可以得到如下一些观察:

 如果满足“大规模广告”+“信任成本-高(>0.75)”,那么这个品类基本上可以出现大品牌,除非“供应链成熟度差”+“供应链与上级品类的差异性小”+“资本进入门槛低”(典型如装修行业),或者除非“所属上级行业有巨型公司”+“供应链与上级品类差异小”(典型如饮料、零食行业)。


“信任成本-中”的行业同样有一定的机会品牌,但情况更加复杂,但总体看满足“供应链与上级品类的差异性-高”、“功能性>个性的需求”、“有用历史传承、配方门槛、IP”将有助于品牌的建立。


● 而对于不满足“大规模广告”特征的行业来说,品牌出现的机会会小很多,但仍然有一些转机,如果品类满足“强供应链/强品质/强服务”、“拥有历史传承、配方门槛、IP”、“供应链成熟度高”、“信任成本高”和“产品化程度高”中的一样或者多样条件。


从单个特征的角度来分析,两个算法结论基本一致,但随机森林给了我们不一样的分析视角。


投资启示


回到我们研究的初衷,除了我们可以通过这些特征维度对品类、品牌进行判断之外,还能给我们投资方向的选择带来哪些启发呢?


? 我觉得至少有两点:


? 选择1->100的机会互联网和科技类的投资更多是0->1,但品牌的建立永远是1->100的过程,而某些特征的改变将会加速这个过程,比如供应链的成熟(手机、家电)、产品化的加强(定制家具)、资本进入门槛的提高(汽车)等等,都将为我们提供10->100的投资机会。


?  选择逆境反转、老树新芽的机会对于满足 “拥有历史传承、配方门槛、IP”、“供应链成熟度高”、“信任成本高”和“产品化程度高”的品类和行业,如果加上合适的产品定位和广告策略,有机会出现大的独立品牌。比如王老吉/加多宝,比如白酒。


最后,感谢原实验室的宇韬大神在百忙之中帮我完成了算法分析,4年不写程序的我真是感激涕零。

--End--

来源声明:文章来源于水小瓜投资笔记,由华盖资本编辑。版权归原作者所有;

版权声明:推送文章除非确实无法确认,我们都已取得授权并注明作者和来源。部分文章推送时未能与原作者取得联系,若涉及版权问题,烦请在后台联系我们,以便我们及时处理。


首页 - 华盖资本 的更多文章: