相较于在多个分布数据量小的文件 , HDFS 更适合在一个文件中具有大量的数据集。这是因为“ Namenode ”是非常昂贵的,高性能的系统中,它是不慎重的占据“ Namenode ”通过了为多个小文件生成的元数据的不必要量的空间。因此,当在一个单独文件中的大量的数据,“ Namenode ”将占据更少的空间。因此,为获得最佳的性能, HDFS 支持大数据集,而不是多个小文件 **
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30