当前位置:首页 > 智能硬件 > 人工智能AI
[导读]   现在好像人人都爱说“大数据”,就像平时我去开会,不是用大数据分析这个,就是用大数据建构那个。可是我最近看《美国计算机学会通讯》(CACM)上面提到了几次小数据,我觉得

  现在好像人人都爱说“大数据”,就像平时我去开会,不是用大数据分析这个,就是用大数据建构那个。可是我最近看《美国计算机学会通讯》(CACM)上面提到了几次小数据,我觉得大家也有必要了解一下这个有趣的概念。

  大数据其实就是一个特别大的数据库,大到用现有的技术无法处理,因此计算机行业的人谈大数据,指的是“大数据技术”。而生命科学领域的人谈大数据是指该领域的“大数据分析”,搞大数据设备和管理的人不见得会分析,因为这需要专业。

  还有一股力量也将改变我们关于健康的想法和实践,那就是由个人数字跟踪驱动的小数据。基于某种云应用,随时间连续地、安全地、私人地分析你工作、购物、睡觉、吃饭、锻炼和通讯的数字追踪,而得到关于你的健康的画面。这里需要私人的装置和网络服务,特别是自跟踪。譬如昨天我有点胃痛,于是想:前天和大前天有何不同呢?啊!明白了,我每天喝一两酒,前天喝的酒不同,换了一个牌子,可能就是这个新牌子的酒引起我胃痛。这个小数据提供了分析我健康情况的依据。

  

  大数据开启了一个时代的转型,给人们带来一场生活、工作与思维的大变革。时代的变革需要以大数据为视角理解数据与信息。

  什么是小数据?小数据就是个体化的数据,是我们每个个体的数字化信息。比如我天天都喝一两酒,突然有天喝完酒了胃疼,我就想了,这天和之前有何不同?原来,这天喝的酒是个新牌子,可能就是喝了这个新牌子的酒让我胃疼。这就是我生活中的“小数据”,它不比大数据那样浩瀚繁杂,却对我自己至关重要。

  第一个意识到“小数据”重要性的是美国康奈尔大学教授德波哈尔·艾斯汀。艾斯汀的父亲去年去世了,而早在父亲去世之前几个月,这位计算机科学教授就注意到老人在数字社会脉动中的些许不同——他不再发送电子邮件,不去超级市场买菜,到附近散步的距离也越来越短。

  然而,这种逐渐衰弱的状态,真到医院去检查心电图,却不一定能看出来。到急诊室检查的时候,不管是测脉搏还是查病历,这个90岁的老人都没有表现出特别明显的异常。可事实上,追踪他每时每刻的个体化数据,他的生活其实已经明显与之前不同。这种日常小数据带来的生命讯息的警示和洞察,启发了这位计算机科学教授——小数据可以看作是一种新的医学证据,它是“your row of their data”(他们数据中属于你的那行数据)。

  人们爱说,大数据将改变当代医学,譬如基因组学、蛋白质组学、代谢组学等等,不过由个人数字跟踪驱动的小数据,也将有可能会对个人医疗带来变革,特别是当可穿戴设备更成熟后,移动技术将可以连续、安全、私人地收集并分析你的数据,这可能包括你的工作、购物、睡觉、吃饭、锻炼和通讯,这些数字追踪将得到一幅只属于你的健康自画像。

  拥有了这幅专属于自己的数字自画像,有什么好处呢?假设你是一名患者,这样精确个体化的小数据也许可以帮助你回答:我每次服药应该用怎样的剂量?当然了,药物说明书上会有一个用药指导,但那个数值是基于大量病人海量数据统计分析得来的,但它适不适合此时此刻的你呢?于是,你就需要了解关于你自己的“小数据”。对于慢性病、抑郁症、记忆力衰退和克罗恩病,很需要日常活动变化的数据。大数据一般是从一个大N的种群里面取得的,而小数据n=me。我们需要数据解放,把移动和网络服务的数据解放到你我自己。

  

  这样一来,小数据也许可以为我们提供更多研究的可能性:能不能通过分析年老父母的集成数据,进而获得他们的健康信息?能不能通过这些集成数据,比较不同的医学治疗方案?譬如数据跟踪能说明你散步可以走多远,你多早离开家,那就可以表明关节炎药物治疗效果如何。

  更令人期待的是,小数据或许还将成为人类攻克癌症的一个好帮手。现在许多人认识到需要用患者的数据进行个性化的癌症治疗。我们要特征化所有患者。肿瘤细胞的DNA引起不同的癌症病人非常不同的变化。譬如,大致相同的基因变异或删除只占患者的10%。即使是同一个肿瘤,其细胞的变异也不同。基因之间的相互作用可能引起二次变异,对患者的治疗影响很大。所以,对许多患者用同一个治疗方法是不可能成功的。个性化或者说层次式的药物治疗是要按照特定患者的条件开出药方——不是“对症下药”,而是“对人下药”。这些个性化的治疗都需要记录和分析个人行为随时间变化的规律,这就是小数据。

  当然,这并不是说大数据就不重要。在医学上发现治疗的一般规律需要大数据。欧美各国都在计划编制患者信息的数据库,不但为了癌症治疗,也为开发新的治疗方法。集成大量在线数据库可以推动个性化用药,减轻他们的痛苦。从大数据得到规律,用小数据去匹配个人。

  大数据流行,大家就“言必称大数据”,可这并不是做学问的态度,不要碰到大量的数据,就给它戴上一顶帽子“大数据”。就像20年前,系统工程也很时髦。哪怕是做报告谈到一个比较大的工程,都说那是系统工程。可系统工程又怎么样呢?“那是很难的”,就没有下文了。我们应该敞开思想,研究实际问题,切忌空谈。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

在全球汽车产业向电动化、智能化转型的浪潮中,中国电动汽车制造商凭借完整的产业链优势和技术创新能力,正从“产品出海”向“生态出海”跨越。物联网作为连接车辆、基础设施、用户与云端的核心技术,打破了地域、标准与服务的边界,通过...

关键字: 物联网 新能源 大数据

在数字化浪潮席卷全球的今天,云计算、大数据、人工智能等新兴技术正以前所未有的速度重塑着我们的生活与工作方式。而在这些技术的背后,虚拟化技术作为基石,默默支撑着整个IT架构的高效运转。从大型企业的数据中心到个人电脑的虚拟机...

关键字: 虚拟化 大数据

在人工智能、自动驾驶与大数据处理等高性能计算场景的驱动下,传统存储体系面临着速度、功耗与可靠性的三重瓶颈。作为典型的非易失性磁电存储技术,磁阻随机存取存储器(MRAM)凭借高速读写、低功耗、非易失性与高耐久性的核心优势,...

关键字: 人工智能 自动驾驶 大数据

上海2025年12月18日 /美通社/ -- 时隔三年,美通社新传播年度大奖与论坛即将在2026年1月15日于上海举办。本次活动不仅将表彰过去一年以来,在内容创新、传播策略与技术监测等领域做出杰出贡献的品牌与个人,还将启...

关键字: AI 大数据 触点 NAS

在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力。从用户行为追踪到供应链优化,从市场趋势预测到风险管控,数据的价值正以前所未有的速度被挖掘。然而,面对海量、多源、异构的数据,传统IT架构已难以满足高效处理与分析...

关键字: 云计算 大数据

苏州2025年11月27日 /美通社/ -- 由希鸥网主办的第36届华商创新论坛将于2026年1月11日在苏州市会议中心隆重举行。同期还将举办第十一届金鸥奖颁奖典礼及ABEC亚洲影响力年度创新盛典。本次活动由金鸥斯瑞大数...

关键字: 人工智能 矩阵 大数据 网络

在当今数字化浪潮中,智算时代正以前所未有的速度席卷而来。随着人工智能、大数据、云计算等前沿技术的迅猛发展,对算力的需求呈指数级增长。数据中心作为算力的核心承载平台,其规模和复杂度不断攀升,而由此带来的散热问题成为了制约行...

关键字: 算力 人工智能 大数据

重庆2025年10月20日 /美通社/ -- 近日,重庆市医学影像大数据与医疗AI研究中心落户江北战略合作框架协议签约活动举行。西门子医疗、重庆市大数据发展局、市卫生健康委、重庆医科大学及江北区政府"五方"代表共同出席。...

关键字: 大数据 应用发展 西门子 医学影像

上海 2025年6月23日 /美通社/ -- 近期,黑芝麻智能分享了其如何通过零拷贝共享内存技术,解决车载多域间大数据传输的延迟与资源消耗问题。核心技术包括全局内存管理单元和dmabuf机制优化,显著降低CPU负载与D...

关键字: 内存 数据传输 大数据 BUF

上海——2025年6月19日,亚马逊云科技中国峰会在上海召开。峰会期间,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松全面阐述了随着生成式AI场景和应用的快速落地,AI发展也迎来Agentic AI技术的爆发,企业需要...

关键字: AI 存储 大数据
关闭