有没有识别非结构化数据中冷数据的好方法?

系统运行多年之后,会有大量的数据变为几乎不访问的冷数据。如果是结构化存储,一般可以用相应的字段来确定归档的范围。但是对于非结构化数据,是不是有更好的方案?比如说访问计数来识别哪些数据是无用的。希望专家指点一下...显示全部

系统运行多年之后,会有大量的数据变为几乎不访问的冷数据。如果是结构化存储,一般可以用相应的字段来确定归档的范围。但是对于非结构化数据,是不是有更好的方案?比如说访问计数来识别哪些数据是无用的。希望专家指点一下

收起
参与9

查看其它 2 个回答白光茁的回答

这个还是需要结合具体的业务场景来看,有的业务场景下的数据时间特性很明显,可以根据时间特性来进行区分。有的业务场景数据的冷热比较明显,也就是有些数据会被频繁访问,这些可以根据访问计数来进行区分。我这边也接触到有的客户的场景是,某些数据可能很久都没有访问,但是偶尔还是会被访问,但是访问可能也就一两次,这种情况下可能就很难预先来进行区分。所以由的客户采用的做法是温数据的处理方式,不再强求数据分冷热,而是所有的数据都放在那里,这样来保证整体的访问体验。

硬件生产 · 2020-07-17
浏览1299

回答者

白光茁 最近回答过的问题

回答状态

  • 发布时间:2020-07-17
  • 关注会员:4 人
  • 回答浏览:1299
  • X社区推广