冷数据特指活动不频繁、不会被经常访问甚至永远不会被访问,但仍然需要长期保留的数据。根据被访问的频度不同,数据可以被分为“热数据、温数据、冷数据”三种类型。数据集合中通常有高达80%的部分属于不常被访问的冷数据。然而,冷数据并非失去价值,大数据、人工智能等新兴业务对海量冷数据进行检索和挖掘的需求依然存在而且日益迫切。
这些数据中有一大部分都属于冷数据即较长时间之前的状态数据,其特点是较低的访问频率,并且需要最大限度的降低其存储成本,同时要求随时可访问。例如微信和QQ上存储的大量的图片信息,社交媒体,智能互联网时代,大量的社交数据产生,用户通常查看新发布的图片、视频,而对于那些旧的数据,则鲜有人问之。