数据规模越来越大,数据种类也多种多样,除了存量系统的数据增长外,新增的IT系统或新采用的技术架构也会产生各种各样的数据。对所有的企业数据做备份代价较高,现实中也不具备条件,那么如何评估这些数据是否需要做备份以及如何备份?想听听同行的一些看法。
这个实际上还是备份需求的分析,需要在调研的时候对不同的应用数据做一个区分,个人总结了以下几点:
1. 先区分下目的,一般情况下业务数据的使用都有冷热特性。备份数据同样也是,有的数据副本是为了应对数据丢失,这种是备份,特点是数据经常发生变化,保留周期相对较短,备份的频率相对较多;有的副本是为了法规遵从,或者很小概率使用的历史数据,这个对应归档,特点是基本不发生变化,保留周期长,备份频率很少。
2. 所数据都备份肯定是不现实的,备份目的是为了恢复,反向推,如果业务出现数据丢失,按最坏的情况算,都需要哪些数据,就备份哪些数据。 然后再根据数据的特点设计,以Oracle为例,归档日志备份的频率最高,数据文件次之,基础环境最少,甚至可以不用备份。
3. 分类后的数据按照rto和rpo的指标设计备份策略即可,既要避免备份无法覆盖需求,也要避免过度设计,浪费资源。
4. 根据业务数据实际需求进行分类,可以进行分级存储存放设计,比如
长期保存,且使用频率极低的归档数据存放到磁带库,定期出库离线保存,保证备份数据有效可查即可
中长期保存的备份数据,使用频率较低的数据,可存放磁带存储、对象存储或大容量低速磁盘存储。
短期保存视频频率较高的备份数据可存放到性能较高的磁盘池,后期酌情迁移到磁带库。
收起对于备份的投入可以根据你的数据的重要性来决定。
首先对数据类型分类,大体上我觉得可以是三种情况。数据库(核心数据),非结构化数据(比如程序代码,图片,文档),应用环境(应用业务的操作系统和应用配置环境)
根据数据的重要性和可以接受丢失的程度来决定怎样的备份手段,数据重要程度一般,可以接受部分丢失,资金投入少的情况下可以采用脚本导出的方式备份到异地环境中,随着数据重要程度增加,则考虑独立专业的备份设备,如备份一体机,当数据重要到无法接受丢失的程度并且要做历史归档查询时,就要考虑近线备份和离线备份,既备份一体机+磁带库(蓝光光盘库)一类的组合方式,
而非结构化文档,往往文件琐碎而众多,可以考虑独立的文档云一类的设备,通过多节点,多副本的方式保存,
操作系统和应用环境往往配置复杂,而且涉及到注册码等重要信息。可以通过虚拟化的架构来实现系统层的灵活迁移和克隆备份。
而上述三种数据情况所采用的备份手段和投入则都应该根据数据,业务的重要性和资金情况决定,个人建议还是尽可能的完善备份环境,不要在备份系统上过于节省。