当前位置:首页 > 物联网 > 智能应用
[导读] 我们身处一个大数据的时代,对大数据应该各有各的感悟,以新闻客户端为例,在首屏看到的都是各自感兴趣的新闻类型和新闻内容;电商网站首页,焦点位置也是个性化推荐。两个星期前,我参加一个朋友给孩子办的满月酒,当我回到家,打开我小米电视机的时候,首屏投出来的是一个婴儿奶粉的广告,当然有些可笑,但的的确确发生了。这都是大数据系统根据我们以往的使用习惯,上网痕迹,借助大数据引擎挖掘、分析的结果,从某种意义上来说,大数据可能比你更懂你自己。各行各业都在收集并利用大量的数据分析结果,降本增效提高产品质量以及不断创新。数据爆炸式增长及价值扩大化,将对企业未来发展产生深远的影响,数据的收集挖掘和应用成为企业生存发展的核心推动力。世界经济格局也将因为大数据时代而产生巨大的变革。

 我们身处一个大数据的时代,对大数据应该各有各的感悟,以新闻客户端为例,在首屏看到的都是各自感兴趣的新闻类型和新闻内容;电商网站首页,焦点位置也是个性化推荐。两个星期前,我参加一个朋友给孩子办的满月酒,当我回到家,打开我小米电视机的时候,首屏投出来的是一个婴儿奶粉的广告,当然有些可笑,但的的确确发生了。这都是大数据系统根据我们以往的使用习惯,上网痕迹,借助大数据引擎挖掘、分析的结果,从某种意义上来说,大数据可能比你更懂你自己。各行各业都在收集并利用大量的数据分析结果,降本增效提高产品质量以及不断创新。数据爆炸式增长及价值扩大化,将对企业未来发展产生深远的影响,数据的收集挖掘和应用成为企业生存发展的核心推动力。世界经济格局也将因为大数据时代而产生巨大的变革。

光存储是大数据时代存放温冷数据最合适的技术手段。原因在于蓝光光盘具有50年存储寿命;其原始数据在物理上不可删改;使用成本是传统存储介质的1/10,此外它可以应付恶劣环境影响,具有非常强的容灾抗灾的能力。光存储是现有存储模式最好的补充。全息光盘的研发,单张光盘获得了1.5TB的容量。如果采用更高性能的传感器,更高性能的感光材料,在2020年将单张光盘容量有望提升到40TB,这将使得我们在第四代光盘技术规格竞争中获胜,那会是中国第一次参与主导光盘技术的规格和标准的制定。

 

当今世界我们个人和家庭大概拥有并长期保存接近1TB数据,企业长期拥有PB级规模数据;城市拥有EB级规模数据,而国家早就超过了EB级规模。这些,大数据呈现这四个特点:

第一个特点是IDC在2017年预计2020年全球数据规模将达到44个EB,而中国将达到8个EB,这里我发现了一个很有趣比例关系,这个比例非常接近于中国人口和全球人口规模的比例,由此得出两个猜测,一个猜测是说数据规模和人口规模密切相关。第二个猜测也许和大家有点不一致,是说中国在大数据应用EB领域,我们只是平均水平。

第二个特点就是我们数据产生越来越快,流转越来越快,数据产生加速增长。如今,我们使用更多摄像头,使用更高像素的摄像头,因此每天产生更多的数据,这些数据需要更强大计算能力处理。这里不仅有结构化数据,也有一些以网页数据为代表的非结构化数据,非结构化数据规模巨大,以音视频、空间物理信息为代表。海量数据如何通过挖掘算法更迅速有效完成价值提存,成为大数据背景下需要解决的难题。

迅速增长的数据是人类社会宝贵财富,但是与此同时也对我们的社会提出了严峻的挑战,在这里我们看到,2017年三峡大坝全年的发电总量大致在1000亿度,与此同时,2017年全国数据中心耗电量已超过了这一数字,达到了1200亿~1300亿度。2020年数据中心耗电量相当于3个三峡大坝,2025年接近于4个,换句话说,呈指数级增长的数据和带来了线性增长的耗电量。在数据中心的成本构成上,不仅有耗电量,还有地产空间的投入,安全方面的投入,涉及数据泄露和数据存储传输过程中数据损失。

 

我们使用传统的存储介质只有3~5年寿命,由此势必需要面对数据迁移的损失风险,以及介质更换的成本。大数据是财富,原始数据不可再生,大数据如何安全的长期保存,这是我们与大家面临的问题。数据存储不管是在云端还是在本地,存储介质都是数据最终的物理载体。就目前的技术发展而言,我们大致会分成三种技术存储介质,机械硬盘、光盘和固态硬盘,他们有各自不同的特性。我们认为在大数据时代光存储是存放温冷数据最合适的技术手段。

第一个原因是蓝光光盘具有50年存储寿命。

第二点原因是原始数据在物理上不可删改。

第三点是其使用成本是传统存储介质的1/10

此外,它可以应付恶劣环境影响,具有非常强的容灾抗灾的能力。

我们今天进入了工业4.0时代,光存储技术凭借绿色节能安全长效的优势,契合了当今信息时代长期安全存储的需求。以此为契机,工信部科技部等部委相关政策的陆续出台,中国光存储技术进入了快速发展阶段。光存储技术首先能够降低耗电成本,光盘介质能够在相对恶劣的环境下保存数据,大大节约了为了维持恒温和环境而消耗大量的能源成本,节约了大量物理空间建设成本,空调散热方面的投入。长达50多年存储寿命,节约了存储介质更换成本以及数据迁移的风险。

 

这里讲的一个数据迁移方式简单,我们假设一个场景,在北京有5PB数据迁移到上海,通过网络传输,成本高、耗时长,光盘能够应付恶劣的运输环境条件,把我们的数据介质从北京寄到上海,就很容易实现这个物理上的数据迁移。兼容性方面,数据存储的本质是为了使用数据,紫晶存储的光存储系统,从第一天开始,就是在一个光电磁混合下面发展,天然对我们各类文件、对象的使用有一个很好的兼容性。光盘在物理上不被篡改,天然对病毒木马以及逻辑错误免疫。

光存储是现有存储模式最好的补充,Gartner把存储系统进行了新的分类,以数据库为主体的结构化数据作为关键业务存储,第二存储针对一些长期保存的非结构化数据。光存储属于第二存储范畴,我相信它能够成为我们的机械硬盘和固态硬盘之外的一个非常好的补充。我相信一个完整高效的针对多种应用的存储框架里面,必然会是这三种技术混合的协同应用。紫晶存储专注于光存储技术的发展,在发展光存储技术的时候,我们提出了一个光电磁融合存储的系统架构,这个架构左边是硬件是远景图,右边是软件的远景图、。我们实现全集统一管理,统一接口扩展虚拟资源池,实现正确时间正确数据存放到正确介质上面去。

接下来看一下光存储技术展望,其中有一个全息技术的维度,就是说,从蓝光到全息。第一代光盘介质是CVD光盘,第二代DVD光盘,第三代蓝光光盘,技术规格和技术标准都是日本欧洲企业主导的,一直紫晶存储在国内推动光存储顶层技术,参与了各项国家各项光盘的标准的制定。今年紫晶参与了另外一个存储项目,就是全息光盘研发,单张光盘获得了1.5TB的容量。这个是我们目前同轴全息技术的原理图。全息技术通常从三个维度增加我们记录的容量,第一个就是位移复用,第二个交叉复用,第三个角度复用,前面所说的1.5TB单张光盘技术只使用位移复用取得的成果,这是全球最接近商业化的全息光盘技术。

如果明年我们能够进一步结合交叉复用和角度复用迅速的把单张光盘容量从1TB提升5~10倍。预计在明年大概率能够获得5TB单张光盘容量。如果采用更高性能的传感器,更高性能的感光材料,我们计划在2020年将单张光盘的容量提升到40TB,我们相信这项技术将使我们在第四代光盘技术规格竞争中获胜,最终获得胜利的技术,那会是中国第一次参与主导光盘技术的规格和标准的制定。未来我们期待能够与更多的研究机构院校以及客户、合作伙伴深入沟通,探索不断完善我们的产品和解决方案,以创新赋能中国存储,做大数据时代的“追光者”。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

赛诺贝斯开创性"三位一体"商业模式:领跑MarTech行业的创新引擎

关键字: 数字化 大数据 大模型 生成式AI

随着大数据时代的到来和计算能力的不断提升,机器学习作为人工智能领域的重要分支,正逐渐改变我们的生活方式和工作模式。机器学习涉及多个学科的理论和技术,其应用广泛且深入,为各个领域的发展带来了前所未有的机遇。那么,机器学习具...

关键字: 大数据 机器学习 人工智能

随着大数据时代的来临,数据的价值日益凸显,如何从海量数据中提取有用信息并转化为实际价值,成为各行各业关注的焦点。机器学习和数据挖掘作为两大核心技术,在数据分析和处理中发挥着越来越重要的作用。本文将通过几个典型的应用案例,...

关键字: 大数据 机器学习 数据挖掘

机器学习将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对它的相关情况以及信息有所认识和了解,详细内容如下。

关键字: 机器学习 数据分析

在这篇文章中,小编将为大家带来机器学习的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: 机器学习 数据分析

随着互联网的迅猛发展,百度、阿里巴巴、腾讯等互联网巨头逐渐崭露头角,成为了行业的领军者。这些公司在云计算、大数据、人工智能等领域积累了丰富的经验和技术实力,为开发者提供了丰富的服务和工具。在这样的背景下,BAT模块应运而...

关键字: 互联网 云计算 大数据

随着大数据时代的来临,机器学习作为人工智能的核心技术之一,已经深入到各个领域并展现出强大的潜力和价值。机器学习通过对大量数据的分析、学习和预测,为各个行业提供了前所未有的机遇。本文将详细介绍机器学习的常见任务,并探讨这些...

关键字: 机器学习 大数据

在机器学习的世界中,数据的有效性至关重要。无效或低质量的数据可能导致模型性能下降,甚至误导模型的训练方向。因此,了解如何评估数据的有效性,以及如何从数据中提取最大价值,成为了机器学习项目成功的关键。本文将探讨机器学习中数...

关键字: 机器学习 数据分析 人工智能
关闭
关闭