工业大数据的分类和挑战
扫描二维码
随时随地手机看文章
实际上,工业数据有三个特点。第一个特点是多模态。过去很简单粗暴地将数据分成结构化数据、半结构化数据、非结构化数据,但工业企业不是这样。今天看到的很多好像格式不一样的、非结构化的工程数据,真正把它打开的时候是不一样的。非结构化数据的使用效率取决于结构化的程度,只有结构化才可以被高效利用;第二个特点是高通量,很多设备是不停机的,所有的数据是7*24小时连续产生的,量非常大;第三个特点是强关联,在工业的不同行业,数据关联遵循不同的规律而非简单的聚合。
所以工业大数据本身的特点带来了非常多的挑战。除了数据获取的挑战,随之而来的就是数据分析、应用的挑战。这里边最大的限制是因果关系,即数据驱动的方法只能告诉我们关联性,而无法不能告诉我们因果性。比如淘宝推荐商品,只知道推荐相关商品,却不关心这个事情的因果——为什么用户是这样的人。但这在工业上是行不通的,尤其是控制方面,因此模型需要长时间的分析和验证。
工业领域存在白盒模型和灰盒模型,白盒模型即工业机理,企业会根据工业机理设计工序、产品结构和工艺,这是第一步。当它们被设计完之后,运行中又会出现大量的不确定性,这些不确定性的消除靠的就是专家、工匠的经验,让整个流程生产变得更加稳定和高效,这是灰盒态。不再对机理和知识本身进行分析和理解的数据模型,是一种黑盒模型。
工业大数据和工业智能的本质就是,将这些经验和知识量化学习出来,挖掘心中有口中无的隐性知识,或者尝试通过数据方法把统计关系找到,再交还给工匠分析。工业就是工业,它存在的时间比信息化时间长,积淀比信息化多,而大数据和人工智能技术只是给工业上带来小的变化,尝试帮它去消除不确定性。