大数据工程技术人员试卷及答案

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:501

试卷答案:没有

试卷介绍: 大数据工程技术人员试卷及答案包含众多的考试题,快来进行考前冲刺练习吧。

开始答题

试卷预览

  • 1. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )

    A频繁模式挖掘

    B分类和预测

    C数据预处理

    D数据流挖掘

  • 2. 下列国家的大数据发展行动中,视大数据为新的自然资源的国家是()

    A中国

    B韩国

    C印度

    D新加坡

  • 3. 若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算。

    AMax

    BMin

    CCount

    DAverage

  • 4. 客户端首次查询HBase数据库时,首先需要从哪个表开始查找。

    A.META.

    B–ROOT-

    C用户表

    D信息表

  • 5. 基于态度的情感分析不包括()。

    A态度的持有者

    B态度的目标

    C态度的类型

    D态度的原因

  • 1. Linux操作中,尽量少使用root用户登陆,减少风险。

    A

    B

  • 2. 数据建模必须要有大量数据和数学算法才能得到结果,调整算法会影响最终的结果。

    A

    B

  • 3. ClouderaCDH是需要付费使用的。

    A

    B

  • 4. Flume不提供数据存储功能而是侧重于数据采集和传输。

    A

    B

  • 5. 数据资源目录中,我们不仅可以完成数据资源的查询,也可以获得想要的数据

    A

    B

  • 1. Hadoop的特性包括哪些?

    A高可扩展性

    B支持多种编程语言

    C成本低

    D运行在Linux平台上

  • 2. Storm具有以下哪些特点?

    A整合性:Storm可方便地与队列系统和数据库系统进行整合

    B简易的API:Storm的API在使用上即简单又方便

    C容错性:Storm可自动进行故障节点的重启、任务的重新分配

    D可扩展性:Storm的并行特性使其可以运行在分布式集群中

  • 3. 一个基本的Hadoop集群中的节点主要包括什么?

    ADataNode:存储被拆分的数据块

    BJobTracker:协调数据计算任务

    CTaskTracker:负责执行由JobTracker指派的任务

    DSecondaryNameNode:帮助NameNode收集文件系统运行的状态信息

  • 4. 下列关于Hadoop的描述,哪些是错误的?

    A只能支持一种编程语言

    B具有较差的跨平台特性

    C可以部署在廉价的计算机集群中

    D曾经被公认为行业大数据标准开源软件

  • 5. 下列关于云数据库与其他数据库的关系,哪些是正确的?

    A从数据模型的角度来说,云数据库并非一种全新的数据库技术

    B云数据库并没有专属于自己的数据模型,云数据库所采用的数据模型可以是关系数据库所使用的关系模型

    C同一个公司只能提供采用不同数据模型的单个云数据库服务

    D许多公司在开发云数据库时,后端数据库都是直接使用现有的各种关系数据库或NoSQL数据库产品