银行业的数据:
1. 交易数据:属于结构化数据,以二维表的形式存在于交易系统数据库当中,属于首要数据。
2. 影像数据:客户签约所需的非结构化或者半结构化数据,存在内容管理平台当中。
3. 历史数据:从数据库当中归档出来的历史数据。
4. 分析数据:从交易系统当中下沉的数据,用来做监管报送、反洗钱、运营分析等的分析类数据。
5. 运维数据:日志、报告、监控等一系列系统运行相关的数据。
存储的选择,究竟是分布式存储还是集中式存储,主要看两点:1. 数据结构是什么样的?如果是交易类的结构化数据,那么一般都是二维表形式,以块数据存取方式为最优。因为存储层与数据库层对数据存取粒度,事务的处理,并发的控制都非常契合,性能也是最好。如果是非结构化或者半结构化的影像数据,不妨选择分布式存储,节省成本而且提高了业务的并发能力。2.稳定性如何?交易类的数据一定要求是稳定的存储平台,不成熟的的分布式架构或者应用资历尚浅的不要轻易用到交易类系统上。
收起