呱呱爱吃瓜

数据仓库工程师银行

回答

IT其它 python
回答于 · 2020-03-13

python课程作业，请大神帮忙指教？

http://www.talkwithtrend.com/Document/detail/tid/433145

赞同
保险海量数据存储 Hadoop 大数据检索
回答于 · 2020-03-05

Hadoop存储海量数据没有问题，但是如何能够做到海量数据的实时检索？

1, 可以结合开源的搜索引擎 Apache Lucene ， Solr 或 ElasticSearch 2, 海量数据的实时检索可以考虑 HBase ，建议可以使用 hadoop 将数据构建成以查询 key 为键的数据集，然后将集合写入 Hbase 表中， Hbase 会自动以 key

赞同
保险 Hadoop 数据集大量小文件
回答于 · 2020-03-05

为什么Hadoop适用于大型数据集的应用程序，而不是具有大量的小文件的应用程序？

相较于在多个分布数据量小的文件， HDFS 更适合在一个文件中具有大量的数据集。这是因为“ Namenode ”是非常昂贵的，高性能的系统中，它是不慎重的占据“ Namenode ”通过了为多个小文件生成的元数据的不必要量的空间。

赞同
保险负载均衡节点 Hadoop
回答于 · 2020-03-05

怎样用Hadoop进行高效的处理小文件?以及怎样让各个节点尽可能的负载均衡?

1、怎样用 Hadoop 进行高效的处理这些小文件 ? hadoop 在处理大规模数据时是很高效的，但是处理大量的小文件时就会因为系统资源开销过大而导致效率较低，针对这样的问题，可以将小文件打包为大文件，例如使用 SequcenFile

赞同
保险 Hadoop hadoop调度器
回答于 · 2020-02-27

hadoop调度器有哪些，它们的工作方法都是怎样的？

1.先进先出调度器（ FIFO ） Hadoop中默认的调度器，也是一种批处理调度器。它先按照作业的优先级高低，再按照到达时间的先后选择被执行的作业 2.容量调度器（ Capacity Scheduler) 支持多个队列，每个队列可配置一定的资源量

赞同1
保险 Hadoop datanode
回答于 · 2020-02-27

DataNode如何理解？

DataNode 也是一个通常在 HDFS 实例中的单独机器上运行的软件。 Hadoop 集群包含一个 NameNode 和大量 DataNode 。 DataNode 通常以机架的形式组织，机架通过一个交换机将所有系统连接起来。 Hadoop 的一个假设是：机

赞同
保险 Hadoop
回答于 · 2020-02-27

Hadoop生态圈子项目有哪些？

HDFS: Hadoop 分布式文件系统 (Distributed File System) MapReduce ： MapReduce 是处理大量半结构化数据集合的编程模型 HBase: 类似 Google BigTable 的分布式 NoSQL 列数据库。 Hive ：数据仓库工具，由 Facebook 贡

赞同
保险 Hadoop mapreduce partition
回答于 · 2020-02-27

MapReduce中combiner、partition的作用各是什么？

(1)、 combiner 有时一个 map 可能会产生大量的输出， combiner 的作用是在 map 端对输出先做一次合并，以减少网络传输到 reducer 的数量。注意： mapper 的输出为 combiner 的输入， reducer 的输入为 combiner 的输出。

赞同
保险 Hadoop yarn 队列
回答于 · 2020-02-07

当用户提交一个作业，指定的队列不存在时，Fair Scheduler会自动创建一个新队列而不是报错，如何避免？

在 yarn-site.xml 中设置 yarn.scheduler.fair.allow-undeclared-pools ，将它的值配置为 false （默认是 true ）。

赞同
保险内存管理 Hadoop yarn
回答于 · 2020-02-07

用户给任务设置的内存量为1000MB，为何最终分配的内存却是1024MB？

为了易于管理资源和调度资源， Hadoop YARN 内置了资源规整化算法，它规定了最小可申请资源量、最大可申请资源量和资源规整化因子，如果应用程序申请的资源量小于最小可申请资源量，则 YARN 会将其大小改为最小可申请量，也就

赞同1

关于呱呱爱吃瓜

用户名：呱呱爱吃瓜
职位：数据仓库工程师
公司：银行
行业：银行
地点：朝阳
社区声望：272
荣誉等级：LV.1

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024 talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广