智能制造专题:制造企业的数据分析之路(转)

  • 作者:王莫
  • 上传时间:2020-08-31 10:08:25
  • 浏览次数:17
  • 返回上级

经过这几年各种层面的宣传,制造型企业(销产研供)的负责人已经熟知很多热词,比如工业互联网,产业互联网,数字化工厂,工业4.0,智能制造,智慧营销,数字化供应链,大数据,人工智能(AI)等,在每天被各种热词灌输的时候,总是不禁想到:


  • 我的企业应该怎么干?
  • 有效果吗?
  • 能否改善经营情况?
  • 能否增加销量?
  • 能否改善库存情况?
  • 能否提高质量?
  • 能否降低成本?等...


种种问题在脑海里翻腾。随着很多公司推出的咨询类、软件类、硬件类、系统集成类的产品和服务,林林总总,让人眼花缭乱,在这些产品和服务里,总是会强调数据分析,大数据,机器学习,人工智能这些热点提高企业管理人员的兴趣,企业管理人员也对此寄于较高的期望值,有些人会觉得这些数据分析的技术能够马上改变企业的现状,解决很多年的顽疾。那么,制造型企业的数据分析之路应该怎么走,怎么做,怎么辨识这些热点技术的适用性,接下来我们会进行讨论和分析。



01

怎样区分热点词汇和技术

对企业的适用性


国家宏观战略和企业落地战略的差异

制造型企业主要是以产销研供为主开展经营和管理的工作,因此消费者放心开心省心、盈利能力、成本下降、高效运营、质量优良、合法合规等是企业落地战略的核心。国家宏观层面战略宣传的热点,很多时候偏重于一个长周期的战略布局且带有其他很多因素,包括国家竞争层面的布局,行业和产业的长期发展等,而制造型企业落地战略在时下的情况更多需要着重在中短期的盈利,一部分会兼顾到长期的发展,所以企业在选择战略的路上,要分清长期和国家宏观战略的匹配,同时短期怎样突破变局和僵局进行对应布局。


同样,对于数据分析类的技术,也要看短期怎样看齐发达国家企业过去几十年积累的数据分析体系、模型和应用,夯实基础,结合管理和经营进行有效的变革。长期要看怎样在有了这些基础之后,在利用更前沿的数据分析技术进行布局,比如大数据,人工智能等技术。当然,对于本来可以一步到位的场景,可以直接采用,但是对于制造型企业,往往这种场景会比较少。对于销售面对电商场景和线下大量门店的消费品制造型企业,往往在营销端短期就要尽快布局云、中台、大数据分析等技术实现快速变现和应对竞争,但是产研供更多依赖中长期的积累和基础才有可能使用更多的前沿数据分析技术,产生投资回报较高的收益。


工业产品和互联网IT产品的差异

第二产业制造出来的工业产品,不管是属于消费类产品还是装备产品、原材料产品、半成品等,和互联网IT产品存在物理本质上的差别,工业产品多是声、光、热、力、电、磁、数据、材料等多学科混合的物理产品,背后蕴藏着复杂的技术,其在产生过程中的数据分析是多种多样的,也有很多的成熟体系存在,比如DoE(实验设计)在研发、工艺、质量甚至市场层面都有成熟的应用,并未因为时下热点的数据分析技术发生本质的变化,也是众多全球业界领先的企业长久以来使用的,其中除了统计学的知识外,还蕴藏着大量的行业知识和多学科知识。


IT产品更多是以代码的形式存在,传统的工业类/行业类IT产品本身蕴含着大量的行业和多学科知识,互联网IT产品本身对制造业和多学科知识缺乏认知和积累,所以就造成了传统的工业类/行业类IT产品在国内的应用并未普及,大家就被新兴热点来自于互联网类的IT产品冲昏了头脑,而着急使用大数据、机器学习、人工智能等技术,想一步登天(当然很多人其实也不知道要多少步才算是登天)。另外,传统的工业产品和互联网类IT产品发展的速度快慢不一。所以要区分工业产品的实质,适用于工业产品的IT类产品,和适用于互联网类的IT产品之间的差异,避免脱实向虚和投资回报过长甚至倒挂。



③ 互联网型企业和制造型企业的差异

一部分电商类型企业或互联网企业从组织上、经营目的上、数据本身和分析方法以及分析工具和数据分析的基础上来看可能存在如下的差异。


*内容有些夸张,只为说明差异。

所以,不管从数据分析的种种维度上和组织上来看,其实两者差异较大,那么,在有这些差异的情况下,我们就需要挑三拣四,找到有用的部分来补足制造型企业的不足。笔者认为最大可借鉴互联网企业的来自于其对C端营销的数据分析技术和经验,以及其信息化系统,其他在销产研供方面更应该借鉴本行业/相邻行业的业界最佳实践为主。



④ 甲方企业和乙方企业的差

虽然这是个老掉牙的话题,但是笔者认为还是有必要讲一下。乙方企业在大谈各种热点技术尤其是数据分析技术及相关技术的时候,总是会描绘很好的结果和场景,但是在商言商,签单子是最重要的。甲方在选择技术的时候要慎重考虑其实用性、适用性和经济性。实用性和适用性就是这个数据分析技术在本领域到底有没有实用价值,适合不适合,还是大牛拉小车?或者大牛拉火车?或者本来就不应该牛来拉车?本来通过更简单的统计分析在excel/Minitab里三分钟能解决的问题,非要使用更复杂的算法花几个月去琢磨,加一个千万的平台,实在是没有必要。


比如,能通过六西格玛解决的质量分析问题、工艺优化问题等,招一个六西格玛黑带做项目可能很快就可以解决,没有必要让互联网企业搭建一个系统,让大数据科学家来解决,效果可能适得其反,大数据科学家也有不能触及的声、光、热、力、电、磁、数据、材料、企业管理等多学科的经验和知识。各位企业家可以思考一下,那些跨国老牌制造型企业,为什么在没有大数据、云的时代一样可以把产品做好、质量做好、经营管理做好、销售和市场做好?他们这几十年是通过哪些数据分析方法、哪些数据分析工具、哪些体系和组织保障建立这么深厚的基础的?他们现在还在用这些吗?我的企业通过热点的大数据技术能够超越他们吗?



⑤ 热点数据分析技术和细分市场的数据分析技术的差异

机器学习、人工智能、神经网络这些词汇总是在找热点,吊住大家的胃口又不让你真正体会到其美味。这里我们要注意其实在很多细分的领域是有成熟的数据分析技术、分析软件以及方法论体系支撑。比如制造型企业中的供应链这个模块,不管从选开店地址、分仓选址、配送路径、仓储操作及库存控制、销售预测、需求管理、计划与排产等,都有成熟的方法论、体系和最佳实践,比如供应链统计学、六西格玛体系等,分析工具也有很多这里不再列举。当然,我们也不能说这些热点的技术是没有用的,在现在数据分析工具里,也开始大量的集成了这些技术,只是这些技术是有一定的适用场景的,但笔者认为其中大多数对普通的制造型企业应用以及效果是及其有限的,而且某些情况下是投资回报很难收回的。


02

制造型企业

使用数据分析的本质


数据分析在制造型企业其实主要就是两个目的:判断和预测。如果按照层次来分,我们可以分为三个层次:


第一个层次: 描述过去已经发生的。比如使用常规excel报表, 说明产销研供各个层面发生了什么。然后通过查询和汇总描述数量、频率和地点等关键因素。在通过BI工具,比如PowerBI, Tableau等进行多维度的透视分析,寻找更多维度的因素。这一层次,是所有制造型企业应该具备的,不幸的是,这一层次中多维度分析透视很多企业还懵懵懂懂,Excel和BI工具的使用还不够深度,对业务和经营管理的理解也欠缺。在这个层次,我们还只是停留在描述统计的领域,并未做更高一些的数据分析。


第二个层次:了解现在正在发生的或短期即将发生的在这个层次,我们进入了高一级的数据分析领域,会采用大量的统计分析方法和工具,数据的实时性也要求较高,即对信息化系统也有一定的要求。比如通过六西格玛中的SPC(制程稳定性控制)来实时采样判断生产制程中的稳定性,以便采取及时的措施控制不良品;比如通过采集多种工艺参数来及时调整原材料的成分或规格波动带来的产量减少;比如通过DOE、田口正交可以判断接下来要做的事情是否合理,不管是配方,效果,工艺参数,营销效果等。这里面即可以根据实时采集的数据进行描述性分析,并结合经验或实验数据进行判读和控制,也可以通过统计分析方法建立数学模型进行自动或半自动判断,比如常见的线性和非线性回归方程、PID、传导方程、矩阵参数调用等。这些方法论即可以使用在生产制造过程中,也可以使用在营销和其他职能体系中,当然,我们也可以使用互联网企业常用的推荐算法,比如对全网销售数据的实时分析,对目标人群的实时动态划分到推送。


在这个领域,数据分析工具就非常的多了,除了常见的Excel, PowerBI, Tableau等工具的深度使用,还有专用的数据分析工具,比如Minitab, JMP, SPSS, SAS等,这些可以使用在传统的统计分析领域和特定的行业(比如生物制药领域),也可以使用在营销等场景下的机器学习应用。除了这些分析工具,很多的工业软件和硬件本身也具有统计分析甚至机器学习的能力,最常见的就是视觉系统,比如Intel的OpenVINO所支持的深度学习算法系统,比如某些MES里集成了SPC的工具。所以,怎样使用现成的领域里的数据分析工具也是一门学问。基本上所有制造型企业需要进行的数据分析场景在现成的各种软件和硬件产品里都有,并不需要重新开发大量的平台和新算法。

笔者认为,绝大数企业应该突破的就是第二个层次,在组织、人才、体系和工具上在中短期着重建设这个部分,赶上发达国家的龙头企业。这块也是发达国家龙头企业在过去几十年数据分析领域着重建设的,并形成了其各个模块的核心竞争力。

第三个层次:预测未来的情况。这里我们要说明一下,在第二个层次中其实我们已经建立了很多模型和算法对未来进行预测。因此,在第三个层次中,我们更加强调除了预测未来的情况还会预测可能出现的不同情况的概率,以及其最好的解决应对方案,以及解决方案会带来的可能的结果。这就更多涉及了AI这个层面,笔者在制造型企业见到这种应用场景偏少(常见的销售预测、质量CPK、研发和工艺的实验设计、可靠性设计及预测、仿真模拟类的、机器学习类的包括预防性维护等都列入第二层次),所以这里不再赘述。也许,这个部分,更多是要借用真正的大数据平台,结合企业内的数据,社会数据,第三方数据等进行深度的学习。



03

制造型企业

使用数据分析的场景


通常在统计学领域,我们把企业的数据都可以叫商业数据,不管这个数据是来自于市场部门、质量部门、服务部门、供应链部门、研发部门还是人资部门。对应的一门学科就叫商业统计学。基于如上的定义,我们来探索一下数据分析和数据分析体系在不同场景中的应用可能是怎样的?(本文限于篇幅不介绍具体案例,只涉及场景)


① 营销

我们分三个主要的场景来说明。第一个是线下营销场景,使用到商业统计分析的主要是产品怎么组合带来的销售额最大、该给哪些消费者寄礼物和卷能够加大其消费概率、哪里选店最合理、区域销售因素主要是哪些因素决定的、销售预测、折扣多少比例能达到最大销售额/销售利润率、哪些产品的反馈更好、应该开发哪些产品、不同产品在不同区域和人群应该怎么投放/陈列等。第二个是线上场景,在这里使用商业统计分析和机器学习的组合方法较多,包含人群圈选和分类、千人千面的营销策略、推送策略、自然语义相关的评论分析等。第三个是营销管理相关的场景,更多是营销活动费用的最大化投入产出、营销策略的好坏及效果、不同区域的营销策略制定、销售预算的有效性/广告有效性、营销团队的分析。

在如上三个主要场景中,牵扯的算法比较多,传统的商业统计分析方法较多,包含假设检验,回归,DoE,机器学习,方差分析,时间序列分析等,使用的工具可以是Excel,JMP,Minitab,Tableau,SPSS,Adobe Analytics等,也可以结合一些SAAS平台的集成工具,比如SAP IBP和CX两个套件里的分析工具,阿里的PAI。具体使用场景要看场景来进行选择。数据分析体系建议主要借用CRISP-DM体系,但是要对商业数据分析建模要有经验,才可以构建出清晰的业务需求。


② 研发

这里我们分为两个主要场景来讲,即一个是偏重于研究和产品开发场景,一个是工艺。在研究和产品开发领域,除了学科领域内的算法,在研发过程中,物理集成/配方的开发、最优组合或参数或者配方对应某一效果/性能/成本/质量/服务/效率的最佳组合、可靠性分析和预测、公差分析、寿命预测等。在工艺场景也类似于研发,比如工艺参数优化、工艺过程控制、工艺开发等。算法上,用到传统的算法比较多,DoE、回归、方差、假设检验等,有特殊场景尤其是比较复杂的超多因素场景,机器学习和神经网络也会有不少应用。在这个部分,常见的数据分析工具有Excel, JMP, Minitab, Matlab, 特殊领域的仿真软件等。数据分析体系建议主要是六西格玛类的体系,在研发端可以使用SPSS体系,在工艺端可以使用经典六西格玛(DMAIC)。


③ 供应链

对于仓储物流、计划体系等场景,着重可以使用经典的供应链统计学,里面有大量的算法可以使用,包含运筹学等。在这里对于制造型企业并未有太大的突破,更多的是怎么使用好现成的方法和算法,不再赘述。比如对库存控制的领域,经典的供应链统计学中有结合库存逻辑和服务水平(六西格玛)和方差来控制最大库存、最小库存、安全库存的量对应销售预测的波动,也可以做到动态安全库存的控制。对于物流仓储设点,配送等可以使用运筹学方法,也可以使用机器学习的算法,最终实现的都是最短路径/最短时间/最小成本/最XXXX。分析工具层面可以使用Excel, JMP, SPSS以及专用的仓储物流仿真工具和分析工具。在数据分析体系上建议使用六西格玛体系。


④ 生产制造

除了工艺以外,质量、设备、计划排产、精益生产技术、shop floor层面、工厂布局/物流路线、EHS、生产组织方式等方方面面其实都可以使用数据分析,这也是经典六西格玛里面讲的比较多的。比如在质量方面,从制程控制SPC、质量提升、抽样控制、判定好坏、识别影响质量的因素等方面在六西格玛里都有各种分析。在设备方面,这里笔者不建议非设备生产商去研究自己工厂设备的预防性维护,因为设备原理其实是不知道的,而且预防性维护偏重于长期的数据收集及学习,比较成功的更多是旋转型设备。设备领域对于重资产型公司,比如化工行业,可以使用分类算法来进行维护维修的判断和打造专家系统,使用分类算法和其他算法来尽量提高设备的在线率,减少MTBF和MTBR等,提高服务水平以此不影响生产效率和质量。计划排产类的算法大多集成在APS软件里,比如遗传算法。精益生产要跟多的结合六西格玛项目推进效果会更好。在生产组织方式可以使用很多的统计学方法来判断不同生产方式的效率、成本、质量等。分析工具角度用的最多的就是Excel和Minitab, 也有不少是用JMP等。在很多的软件系统里是集成了相应的工具。最常见的就是质量信息系统里集成了SPC等质量相关的统计分析工具。在数据分析体系上建议使用六西格玛体系。


⑤ 其他职能模块:

除了如上四个大的模块,其他职能也可以充分使用数据分析提高管理水平和效率,减少风险和成本。比如在人资,可以使用统计分析来分析人员结构,薪资结构,不同培训课程的培训效果,人员离职的分类及对策等。在风控领域,更多是看数据的波动和异常,尤其是财务类,这里方差类分析也是有用的,机器学习类比如分类算法也是常用的。甚至在经营和战略层面,我们也可以使用回归和方差等分析来判断预算是否能够产生经营效果,并对未来的销售进行预测。数据分析体系上我们还是建议使用六西格玛体系,这里要说明的六西格玛体系非常适合流程再造,流程效率/出错率改善,在服务型的场景是非常适用的,提高流程效率比如接单评审效率等也是可以做出一番成绩的。


04

制造型企业

搭建两级数据分析组织


采用两级数据分析的虚拟组织通常是大公司的业界最佳实践。
● 第一级,即在总部层面或者某一部门内部有行业专家掌握数据分析的能力可以对重大变革项目进行支撑,同时兼任培训培养和提高本组织内的数据分析能力的职能,构建本体系内的数据分析体系、方法论、模型、工具选择等;
● 第二级,即全体员工或部分骨干员工,掌握一定的数据分析能力,具有对日常工作运用其数据分析的能力,其在第一级专家所构建的数据分析体系、方法论、模型和选定的工具之下进行操作。比较典型的案例就是六西格玛体系和IPD(集成产品开发)中的DFSS体系。

总结:对于产销研供的制造型企业,一是建议企业要明白自己的痛点,在根据痛点来布局组织、人才、方法论体系、工具和流程;二是建议要打好基础,不管是管理的基础还是数据分析的基础;三是切勿好高骛远,认为热点的技术能够马上提高企业竞争力,只有当数据分析和企业的经营管理以及决策等较好的结合,才能产生比较大的效果,形成企业的核心竞争力。



名词定义
统计学:是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。
商业数据:所谓商业数据,是指一个产业,其价值链上各个重要环节的历史信息和即时信息的集合,其内容包括商业企业内部数据、分销渠道数据、消费市场数据等。它不但能揭示这个产业的历史,还能反映产业的最新发展,更重要的是能预示产业的未来,为该产业价值链上各类企业的战略、研发、营销、管理等提供可靠的咨询和指导。
商业统计学:商业统计学是社会经济统计学的一个分支,是商业统计工作实践经验的科学总结和理论概括,并随着商业统计实践的发展而不断完善。商业统计学研究商业统计工作的规律,阐述有关商业统计工作的理论和方法,即如何搜集、整理商业统计资料和如何开展商业统计分析与预测的理论和方法,指导商业统计工作的实践。
大数据:在维克托.迈尔-舍恩伯格及肯尼斯.库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
机器学习:是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。


本文转载自数字化企业,作者王莫,原文标题《制造企业的数据分析之路》