系统运行多年之后,会有大量的数据变为几乎不访问的冷数据。如果是结构化存储,一般可以用相应的字段来确定归档的范围。但是对于非结构化数据,是不是有更好的方案?比如说访问计数来识别哪些数据是无用的。希望专家指点一下
收起这个还是需要结合具体的业务场景来看,有的业务场景下的数据时间特性很明显,可以根据时间特性来进行区分。有的业务场景数据的冷热比较明显,也就是有些数据会被频繁访问,这些可以根据访问计数来进行区分。我这边也接触到有的客户的场景是,某些数据可能很久都没有访问,但是偶尔还是会被访问,但是访问可能也就一两次,这种情况下可能就很难预先来进行区分。所以由的客户采用的做法是温数据的处理方式,不再强求数据分冷热,而是所有的数据都放在那里,这样来保证整体的访问体验。