互联网服务系统运维Hadoop

HADOOP比JOB更消耗资源,怎样的建构使物理资源得到充分的发挥?

用户的话单大小为100KB左右每天大约有上亿条待处理,使用HADOOP处理明显要比1G左右的JOB更消耗资源,怎样的建构使物理资源得到充分的发挥,又有效的做到数据的稽核比对?显示全部

用户的话单大小为100KB左右每天大约有上亿条待处理,使用HADOOP处理明显要比1G左右的JOB更消耗资源,怎样的建构使物理资源得到充分的发挥,又有效的做到数据的稽核比对?

收起
参与10

查看其它 2 个回答loveryue的回答

loveryueloveryue软件开发工程师IBM

Job的优化一直是分布式计算的核心,最关键是要知道哪些job执行时间长,影响整个计算模型的结果,然后 通过调整split大小,改变中间文件类型等手段加速。

互联网服务 · 2015-11-06
浏览2114

回答者

loveryue
软件开发工程师IBM
擅长领域: 服务器数据库大数据

loveryue 最近回答过的问题

回答状态

  • 发布时间:2015-11-06
  • 关注会员:4 人
  • 回答浏览:2114
  • X社区推广