目前我们所知,大数据环境中互联网公司都是以hive为数据仓库入口的统一管理,那spark sql使用中在商用环境下的使用率如何?如何评估底层使用MR ?TEZ?spark?中的哪一种作为执行引擎呢?
建议还是按照实际需求进行选择,如需要批量非实时的,选用hive MR,需要实时获取选取spark
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30