工业大数据的分类和挑战

时间：2019-08-29 14:57:33

关键字：信息化大数据智能

手机看文章

扫描二维码
随时随地手机看文章

[导读] 实际上，工业数据有三个特点。第一个特点是多模态。过去很简单粗暴地将数据分成结构化数据、半结构化数据、非结构化数据，但工业企业不是这样。今天看到的很多好像格式不一样的、非结构化的工程数据，真正把它打开的时候是不一样的。非结构化数据的使用效率取决于结构化的程度，只有结构化才可以被高效利用;第二个特点是高通量，很多设备是不停机的，所有的数据是7*24小时连续产生的，量非常大;第三个特点是强关联，在工业的不同行业，数据关联遵循不同的规律而非简单的聚合。

实际上，工业数据有三个特点。第一个特点是多模态。过去很简单粗暴地将数据分成结构化数据、半结构化数据、非结构化数据，但工业企业不是这样。今天看到的很多好像格式不一样的、非结构化的工程数据，真正把它打开的时候是不一样的。非结构化数据的使用效率取决于结构化的程度，只有结构化才可以被高效利用;第二个特点是高通量，很多设备是不停机的，所有的数据是7*24小时连续产生的，量非常大;第三个特点是强关联，在工业的不同行业，数据关联遵循不同的规律而非简单的聚合。

所以工业大数据本身的特点带来了非常多的挑战。除了数据获取的挑战，随之而来的就是数据分析、应用的挑战。这里边最大的限制是因果关系，即数据驱动的方法只能告诉我们关联性，而无法不能告诉我们因果性。比如淘宝推荐商品，只知道推荐相关商品，却不关心这个事情的因果——为什么用户是这样的人。但这在工业上是行不通的，尤其是控制方面，因此模型需要长时间的分析和验证。

工业领域存在白盒模型和灰盒模型，白盒模型即工业机理，企业会根据工业机理设计工序、产品结构和工艺，这是第一步。当它们被设计完之后，运行中又会出现大量的不确定性，这些不确定性的消除靠的就是专家、工匠的经验，让整个流程生产变得更加稳定和高效，这是灰盒态。不再对机理和知识本身进行分析和理解的数据模型，是一种黑盒模型。

工业大数据和工业智能的本质就是，将这些经验和知识量化学习出来，挖掘心中有口中无的隐性知识，或者尝试通过数据方法把统计关系找到，再交还给工匠分析。工业就是工业，它存在的时间比信息化时间长，积淀比信息化多，而大数据和人工智能技术只是给工业上带来小的变化，尝试帮它去消除不确定性。