当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读] (全球TMT2021年8月6日讯)经历近两个世纪蝶变,影像技术与数字技术不断融合,数字影像占据了行业主导。特别是随着大数据和深度学习等新技术加持,影像大数据产业发展不断提速,IDC研究表明,未来行业

(全球TMT2021年8月6日讯)经历近两个世纪蝶变,影像技术与数字技术不断融合,数字影像占据了行业主导。特别是随着大数据和深度学习等新技术加持,影像大数据产业发展不断提速,IDC研究表明,未来行业80%的行业数据将以照片、音频、视频等非结构化影像数据方式呈现。海量影像数据的“存”和“用”就像赛车两个驱动轮,影响着各个行业在数字赛道上飞驰的速度。作为新存储首倡者和引领者,浪潮存储凭借五年五次霸榜的极致“造车”技术,持续为行业影像大数据处理提速。

行业影像数据大爆发  如何才能“接得住、存得快”

随着行业数字化转型不断深入,企业数据资产从关键业务产生的结构化数据为主逐渐演变为非结构化影像数据为主,同时企业IT业务重心从数据管理变为数据运营。如何提升数据存储性能,快速从巨量影像数据中获取数据价值,成为企业提升竞争力的关键。

以金融行业为例,在Bank4.0趋势下随着银行网点向营销型、体验型智慧网点转变,各大银行正全面推进无纸化办公,票据、单证、电子验印、影像审批等业务处理过程渐趋电子化,带来了影像数据实时存储和处理的需求井喷式增长。

浪潮存储方案架构师Howar表示,“金融影像大数据就像蚂蚁军团,特点是‘个头小’、‘数量多’,海量金融影像并发处理是典型的性能密集型场景”。Howar给算了笔账,票据影像经过压缩后,每个影像大小约在在几十K至几百K之间,多见的是100K左右的影像,但影像规模极为庞大,依据银行规模与业务上线时间不同,单套存储系统需要处理的影像规模达到数千万至数亿份。同时随着金融监管要求日趋严格,大量录音、录像、图片也需要实时保存并高效访问。

不仅金融如此,在通信、能源、交通、媒资、科研、医疗等诸多行业,也同样面临影像大数据处理的挑战,这个行业用户的共性需求可以称之为“性能现象级”。其中在通信行业,随着14亿人将衣食住行搬上网络,移动互联网2020年数据流量高达1656亿GB;在互联网行业,快手每天产生1.2亿个内容标签与用户画像实时匹配,内容精准推送背后是海量数据关联碰撞的结果;在交通领域,网红城市成都有超6000路交通视频流实时汇入,每天需要处理1亿张图片、10次搜索。这些实时数据如同长江大河源源不断、昼夜不息地注入后端数据基础设施,如何“接得住、存得快、用得快”成为数据存储面对的挑战。

智慧交通产生海量实时数据

一道“性能”考题  引出三种范式

虽然大部分行业都面临大数据处理挑战,但不同行业、不同业务、不同数据生命周期的性能需求存在三种范式:以媒资4K/8K、脑成像研究等应用场景为代表,数据处理属于“带宽密集型”范式;以金融影像应用场景为代表,影像数据以海量小数据为主,属于“IO密集型”范式。最后是混合型,在智慧交通、能源勘探等场景,在前期数据采集阶段,海量数据流实时汇入给存储带宽提出了挑战,到了后期人工智能分析阶段,企业需要处理十亿级乃至百亿级小文件,需要极致IO能力来支撑。                       

Howar告诉我们,浪潮分布式存储能够以一套存储满足上述三种性能范式需求。浪潮存储开发了业界首个“块、文件、对象、大数据多合一”极简架构和iTurbo智能加速引擎,此存储系统能够统筹管理数千个节点,实现性能线性扩展。

浪潮存储

在带宽密集型应用中,浪潮存储通过聚合带宽技术,能够支撑数据流高速吞吐,确保海量影像洪流“接得住、存得快”。同时,浪潮存储还能进行场景化定制,比如在石油勘探场景,浪潮存储通过对去躁、振幅补偿等多项作业的优化配置,提升了石油勘探批量作业的处理能力,增强了易用性,确保系统高速稳定运行。

在IO密集型场景,面对亿级影像小文件并发处理的挑战,传统集中式NAS存储有些力不从心。NAS文件系统架构采用树形目录结构,遍历影像文件需要极大的资源消耗,当影像文件达到上亿级别时,就会出现性能严重下降的问题。对此,浪潮分布式存储一套存储支持文件、对象等多种数据类型的优势就显示出来了:当用户影像业务规模较小时,可以采用文件存储方式,这种方式比较常见,占到中国分布式存储约50%的市场份额,企业大部分运维人员都能轻松上手;随着业务成长,一旦影像规模达到亿级,可以采用对象方式进行扁平化管理。在对象存储模式下,每个桶和对象都有一个全局唯一的ID,根据ID可快速实现对象的查找和数据的访问,性能大幅提升。

影像大数据场景解决方案
影像大数据场景解决方案

浪潮存储的极简架构做得比较人性化,用户可以根据业务需求,在多种数据服务之间进行资源切换,Howar表示。这项功能就好比浪潮存储是一个工厂,用户今天想开轿车就按轿车尺寸装,过段时间想开SUV就把轿车拆了进行改装,虽然在物理世界这个实现起来很有挑战,但在数字世界还是被浪潮存储实现了。

不仅如此,浪潮存储还针对性能开发了iTurbo智能加速引擎,通过智能IO均衡、智能资源调度、智能元数据管理等创新技术,与自研NVMe SSD闪存盘进行系统级别联调优化,让百万级IO均衡落盘且路径更短,将存储系统性能发挥到极致,有效地提升了从海量影像中“大海捞针”的效率。

五年五次飙榜  浪潮存储将性能优势转化为市场竞争力

基于对行业“性能现象级”的洞察和存储技术持续打磨,浪潮存储实现五年五次性能飙榜。早在2017年浪潮存储以超150万IOPS创下了8控存储的业界最高成绩,时隔3年浪潮存储以5倍的性能再获16控、8控、单位成本性能三项冠军。今年浪潮存储在分布式存储领域再次突破,实现五年五次霸榜,成为全球唯一一家在分布式存储和集中式全闪存储两大赛道领跑的存储厂商。

当前浪潮存储已经进阶全球前五,成为全球增长最为强劲的存储厂商。在影像数据处理领域,浪潮存储已经在中国天眼天文大数据、清华大学顶级脑成像研究、中石油三维勘探、中国人寿内容管理等数百个行业新应用中规模化部署。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

赛诺贝斯开创性"三位一体"商业模式:领跑MarTech行业的创新引擎

关键字: 数字化 大数据 大模型 生成式AI

随着大数据时代的到来,数据处理成为了一项至关重要的任务。传统的数据处理方法往往面临着效率低下、准确性不高等问题,而机器学习技术的兴起为数据处理带来了全新的解决方案。本文将深入探讨机器学习在数据处理中的应用,并分析其优势和...

关键字: 数据处理 计算机 机器学习

随着信息技术的飞速发展和大数据时代的到来,数据挖掘和机器学习作为数据处理的两大核心技术,在各行各业中发挥着越来越重要的作用。然而,尽管数据挖掘和机器学习在很多方面存在交集,但它们各自具有独特的定义、方法和应用场景。本文旨...

关键字: 数据挖掘 机器学习 数据处理

随着大数据时代的到来和计算能力的不断提升,机器学习作为人工智能领域的重要分支,正逐渐改变我们的生活方式和工作模式。机器学习涉及多个学科的理论和技术,其应用广泛且深入,为各个领域的发展带来了前所未有的机遇。那么,机器学习具...

关键字: 大数据 机器学习 人工智能

随着大数据时代的来临,数据的价值日益凸显,如何从海量数据中提取有用信息并转化为实际价值,成为各行各业关注的焦点。机器学习和数据挖掘作为两大核心技术,在数据分析和处理中发挥着越来越重要的作用。本文将通过几个典型的应用案例,...

关键字: 大数据 机器学习 数据挖掘

随着信息技术的飞速发展,云计算作为一种新兴的计算模式,正在逐步改变着传统的数据处理和应用方式。云计算通过整合大量分布式计算资源,为用户提供高效、灵活、安全的数据存储和计算服务。在当前数字化、网络化、智能化的时代背景下,云...

关键字: 云计算 数据处理 智能化

随着信息技术的飞速发展,数据处理和传输速度的要求越来越高,从而催生了高速器件技术的迅速崛起。高速器件,也称为高频器件或高速集成电路,是指能够在高频或高速条件下工作的电子器件。它们在现代通信系统、计算机、雷达、电子对抗、高...

关键字: 数据处理 高速器件 通信系统

随着互联网的迅猛发展,百度、阿里巴巴、腾讯等互联网巨头逐渐崭露头角,成为了行业的领军者。这些公司在云计算、大数据、人工智能等领域积累了丰富的经验和技术实力,为开发者提供了丰富的服务和工具。在这样的背景下,BAT模块应运而...

关键字: 互联网 云计算 大数据

随着大数据时代的来临,机器学习作为人工智能的核心技术之一,已经深入到各个领域并展现出强大的潜力和价值。机器学习通过对大量数据的分析、学习和预测,为各个行业提供了前所未有的机遇。本文将详细介绍机器学习的常见任务,并探讨这些...

关键字: 机器学习 大数据
关闭
关闭