当前位置:首页 > 物联网 > 智能应用
[导读] 随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。近年来,全球大数据产业发展迅速,行业应用得到快速推广,市场规模增速明显,大数据对于人们生活方式、国家经济发展以及社会治理方式都带来了巨大的影响。利用大数据对个人数据的挖掘和分析,能够帮助企业更好的理解用户需求,提供个性化定制服务,实现减少经营成本,提高服务效率和提升用户体验的目的。

 随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。近年来,全球大数据产业发展迅速,行业应用得到快速推广,市场规模增速明显,大数据对于人们生活方式、国家经济发展以及社会治理方式都带来了巨大的影响。利用大数据对个人数据的挖掘和分析,能够帮助企业更好的理解用户需求,提供个性化定制服务,实现减少经营成本,提高服务效率和提升用户体验的目的。

2017年1月,我国工信部发布了《大数据产业发展规划2016-2020年》,进一步明确了促进我国大数据产业发展的主要任务和保障措施。党的十九大也明确提出要构建以数据为关键要素的数字经济,推动大数据与实体经济的深度融合,并且切实保障国家数据安全。根据有关公开数据显示,全球大数据行业市场规模呈爆发性增长,全球数据总量将从2016年的16.1ZB增长到2025年的163ZB(约合180万亿GB),十年10倍的增长,复合增长率为26%。数据量的快速增长已经远远超越单个计算机存储和处理能力,数据中心处理能力变得日益重要,同时也驱动着数据中心网络不断向大带宽低时延方向演进。

数据来源:中国产业信息网,图表1 2016—2025年全球数据总量预测图

2017年超大规模数据中心新增90个,总量从2016年的300家增加到390家。绝大多数超大规模数据中心仍位于美国,占比44%;中国位居第二,占8%;其次是日本和英国,分别占6%;澳大利亚、德国紧随其后,占比5%。2017年底在建的项目有69个,按照目前的速度,到2019年底前全球超大规模数据中心的数量有望突破500个,2020年有望突破600个,市场规模也将从2016年的202.4亿美元增长到2020年的490亿美元,复合增长率为24.7%。

数据来源:中国产业信息网,图表2 2016—2025年全球数据总量预测图

数字经济时代,数据已成为特殊的资产,能够在被使用和流转中不断创造新的价值。然而,数据造假问题泛滥,大量用户数据被泄露等问题使得大数据产业的发展备受质疑。投资人在选择和评估一个产品或企业时,主要通过用户量、活跃用户量、使用时长、点评量数据判断产品的是否值得投资,而众多互联网平台为了获得利益,采用了数据造假的手段。社交媒体“制造用户”、电商平台“刷单”、点评类网站“刷好评”等数据造假例子屡见不鲜,随着新媒体产品更新迭代,还出现了给直播、短视频等刷赞的业务。

近期大型互联网平台数据泄露事件也频频出现,雅虎、谷歌及万豪等著名企业下大量用户的隐私数据被盗取。Verizon 公司《2018 年数据泄露调查报告》显示,48%的数据泄露与黑客攻击有关,但是内部操作错误及特权滥用等内部攻击方式也是数据泄露的主要原因。

随着大数据行业的增长,大数据的可信性和隐私安全性已成为现阶段技术所需解决的重点,不仅要降低外部攻击的风险,还要从技术上实现内部防范与管理。

大数据合法收集、市场计量、脱敏流转、开放应用的痛点问题亟待标准化解决方案,目前新加坡WOLOT基金会的TOOL数金链生态解决方案有效的解决了上述难点问题,其运用大数据合法收集即用户主动授权参加行为数据挖矿确权机制,通过数据的信息广度、数量、质量等衡量参数对用户的数据价值公允计量定义出企业衡量规范,通过标准化数据彻底脱敏创新方案有效进行数据隐私保护,最终把用户授权收集、流转、应用的数据价值标记进行市场化衡量。初期会先形成联盟企业规范,逐步完善上升到行业标准,努力成为未来数字经济的数据衡量流转运用的国际标准。

据了解新加坡WOLOT基金会已经完成了下列的能力建设:

(一)实时行为数据的记录规范

行为数据分类:过往履历数据、日常消费数据、行为动作数据、金融资产数据、社交人脉数据,用户通过客户端上传数据或实时产生数据可以获得贡献权益确认,平台通过贡献的权证进行标记把价值权益返还给生态贡献者,使得用户通过数据贡献获得额外的平台回报及在平台超值消费的权益,这样可以刺激需求端的消费能力进而做到供给侧变革。

(二)确保数据的真实性及不可篡改性

数据造假主要是通过无效的“用户”进行刷量及篡改数据等方式使得数据失去其真实性,变成了具有误导性的信息。通过定制化部署的北斗区块链(https://bdqkl-inc.com/)天玑存证系统可以利用区块链存证的方式,将交易记录等账目信息打包成一个个的区块并进行加密,同时盖上时间戳,所有区块按时间戳顺序连接成一个总账本。并运用协议规定的密码机制进行了认证,保证不会被篡改和伪造,因此任何交易双方之间的价值交换活动都是可以被追踪和查询到的。但是如果想要在区块链中修改“账本记录”,需要把整个链条上的加密数据进行破解和修改,这几乎是不可能做到的。

此外,另一个安全的因素是天玑系统利用了区块链的分布式存储的方式。即使黑客破解和修改了一个节点上的信息,数据指纹就会发生变化,篡改者需要同时修改网络上超过半数的系统节点数据才能真正的篡改数据。

(三)保护数据的隐私性

传统的数据脱敏是在保留数据原始特征的条件下,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在不违反系统规则条件下,对真实数据进行改造并提供使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。而在数金链上,通过天玑系统会对数据进行标准化封装,所有包含身份证号、手机号以及卡号等隐私信息全部做真正的脱敏处理(直接删除不是转化),企业对用户进行分析时,使得企业可以分析用户的行为偏好和特征等数据,但无法知道用户身份等隐私信息。想要触达客户需要通过定制的行为数据挖矿任务推送给客户。

用户注册时授权平台可以在接入的生态合作伙伴APP上搜集个人的行为数据,自主参与行为数据挖矿的区块链生态,平台通过前端的埋点技术及对应的任务记录系统进行跨平台的个人行为数据收集,数据的内容涵盖用户实时产生和用户主动提交两大来源,数据的分类有过往履历数据、日常消费数据、行为动作数据、金融资产数据、社交人脉数据以及未来在平台相关生态场景的履约数据。每天数据进行脱敏处理后导出数据文本文件获得各个接入平台文件的hash值和文件大小记录后压缩打包再次文件的hash值和文件大小相关信息记录到区块链,这样就为每天获得的行为基础数据打上数据质保标签,确保当时记录的数据可信有序无法篡改。未来基于这些原始的可信数据进行整理再加工,进而服务建设数字经济新生态,为数字进程中的全球各国贡献数金链的解决方案。

对于数据而言如何确保数据真实性不可篡改性;有效保障隐私数据安全;标准化数据指标;客户授权数据采集和使用显得尤为重要,新加坡WOLOT基金会的创新性技术解决方案创新细节如下:

确保数据真实性不可篡改性

利用天玑系统的功能,通过区块链技术记录每天的系统数据导出的指纹(哈希值),若对应的数据包有一个字节被修改,数据指纹就会发生变化。

加密哈希函数的一个重要特质是任何输入端的细微变化都会对哈希函数的输出结果产生剧烈影响。假设在上面的图表中,有人尝试篡改1号区块中的数据。那么,即便有人尝试对1号区块里的数据进行细微的改写,也会使得存储在2号区块里的1号区块的哈希值产生巨大的变化。接下来,这将导致2号区块的哈希值发生变化,进而影响存储在下一个区块的哈希值。以此类推,最终整条链上的数据都会发生变化。这种通过冻结整条链条来修改数据的方式几乎是不可能做到的。

标准化数据指标

通过数据涵盖场景范围、时间跨度、行为数据数量、数据价值转换频次、数据可分析个体数量等信息来衡量数据包的价值。每天哈希存证记录的数据包可以通过可信程序化自动重组。

客户授权数据采集和使用

符合国际惯例实现数据的个体主权、企业主权、国家主权,客户接入生态就要求授权平台采集和使用,平台作为数据载体必须将数据存储在对应数据贡献人所在的国境内。

目前数金链的生态体系已经接入了国民蛋巢、掌肥猫、斑鸠职业、币航、U萌店、i生活等DAPP,整个生态的用户数量和接入商家迅猛增长,随着用户的数据沉淀生态的整体价值在不断推升,但任何事物的价值认知都需要一个再平衡的过程,因为早期的预挖释放与生态商家接入生态转换存在时间差,数据价值标记对应的市场价值衡量会存在偏差。

就如同比特币的披萨日一样,用2万的比特币买了一份披萨的行为在生态早期一定存在,但是随着数据价值的再分配和生态的快速发展,价格和价值一定会慢慢的重新匹配。数据挖矿的本身就是把浪费的数据资源收集起来,相当于用户通过生态无偿额外获得的增值收获,所以参与生态的用户应该心态平和,对于用户自己更应该清楚每天辛苦点击、购买与浏览背后的价值。有效用户的时间就是价值,在互联网上一次有效浏览或点击就是价值,百度的单位点击成本(ACP)要3-4元,背后的数据价值更不可计量,用户自己可以测算获得一个数据价值标记背后实际映射的公允价值。当然在市场供需的再平衡期间,愿意低价出售数据价值标记的用户也一定会存在,这就看个人的判断了。

有效保障隐私数据安全

未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,在未来,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。而所有企业,无论规模大小,都需要重新审视今天的安全定义。在财富500强企业中,超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障,而并非在数据保存的最后一个环节,仅仅加强后者的安全措施已被证明于事无补。

通过天玑系统会对数据进行标准化封装,所有包含身份证号、手机号以及卡号等隐私信息全部不做记录和显示,只有一个UID和开放平台的用户对应,所有流转的数据不包括任何隐私信息。此外,只有把UID透过接入的应用系统或授权的管理员,在必须知晓的业务场景下,才可通过特定应用程序与工具访问数据的真实值,从而避免隐私数据在共享、移动时带来的信息泄露风险。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

深圳2024年4月17日 /美通社/ -- 4月9日,由AICPA & CIMA 国际注册专业会计师公会携手香港中文大学(深圳)联合主办的 "2024 CGMA全球财金人才论坛" 在深圳前海举行。AICPA & CIMA...

关键字: AI 数字化 人工智能 数字经济

赛诺贝斯开创性"三位一体"商业模式:领跑MarTech行业的创新引擎

关键字: 数字化 大数据 大模型 生成式AI

随着大数据时代的到来和计算能力的不断提升,机器学习作为人工智能领域的重要分支,正逐渐改变我们的生活方式和工作模式。机器学习涉及多个学科的理论和技术,其应用广泛且深入,为各个领域的发展带来了前所未有的机遇。那么,机器学习具...

关键字: 大数据 机器学习 人工智能

随着大数据时代的来临,数据的价值日益凸显,如何从海量数据中提取有用信息并转化为实际价值,成为各行各业关注的焦点。机器学习和数据挖掘作为两大核心技术,在数据分析和处理中发挥着越来越重要的作用。本文将通过几个典型的应用案例,...

关键字: 大数据 机器学习 数据挖掘

随着互联网的迅猛发展,百度、阿里巴巴、腾讯等互联网巨头逐渐崭露头角,成为了行业的领军者。这些公司在云计算、大数据、人工智能等领域积累了丰富的经验和技术实力,为开发者提供了丰富的服务和工具。在这样的背景下,BAT模块应运而...

关键字: 互联网 云计算 大数据

随着大数据时代的来临,机器学习作为人工智能的核心技术之一,已经深入到各个领域并展现出强大的潜力和价值。机器学习通过对大量数据的分析、学习和预测,为各个行业提供了前所未有的机遇。本文将详细介绍机器学习的常见任务,并探讨这些...

关键字: 机器学习 大数据

人脸识别技术作为一种高效、准确的身份识别方式,近年来得到了广泛的应用和发展。随着人工智能、大数据等技术的不断发展,人脸识别技术的准确度和可靠性得到了显著提高。本文将探讨人脸识别技术的发展现状和未来趋势。

关键字: 人脸识别 人工智能 大数据

人工智能是“十四五”规划明确优先发展的前沿科技领域之一,如何看待未来我国人工智能领域的发展前景?目前,我国机器人基础研究状况如何?

关键字: 人工智能 物联网 大数据

北京——2024年1月23日 行业数字化服务商华讯网络系统有限公司(简称华讯)充分利用亚马逊云科技丰富的数据和安全服务以及解决方案,结合自身在安全领域的技术优势和深厚沉淀,为企业提供涵盖安全事件响应、云原生安全大数据平台...

关键字: 大数据 数据分析 互联网
关闭
关闭