大数据工程技术人员试题及答案(二)

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:322

试卷答案:有

试卷介绍: 本站为大家带来了大数据工程技术人员试题及答案(二)的模拟试卷,快来进行练习吧。

开始答题

试卷预览

  • 1. 当前社会中,最为突出的大数据环境是( )

    A互联网

    B物联网

    C综合国力

    D自然资源

  • 2. 在每个超步中,Worker调用顶点上的Compute等线()函数,下列哪个参数是不需要传递?

    A该顶点的当前值

    B一个接收到的消息的迭代器

    C一个出射边的迭代器

    D一个入射边的迭代器

  • 3. 下列说法错误的是?

    A大数据魔镜是一款优秀的国产数据分析软件,可以让用户真正理解探索分析数据

    BTableau是桌面系统中最简单的商业智能工具软件,是一个用于网页作图、生成互动图形的JavaScript函数库

    CGoogle Fusion Tables让一般使用者也可以轻松制作出专业的统计地图

    DModest Maps是一个小型、可扩展、交互式的免费库,提供了一套查看卫星地图的API

  • 4. 下列关于数据处理流程,说法有误的是?

    A在传统的数据处理流程中,存储的数据是旧的

    B在传统的数据处理流程中,需要用户主动发出查询来获取结果

    C传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中

    D流计算的处理流程一般包含三个阶段:数据实时采集、数据批量计算、实时查询服务

  • 5. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种()

    A数据管理人员

    B数据分析员

    C研究科学家

    D软件开发工程师

  • 1. 在数据管理的组织架构中,第三层的各业务部门只具有数据提供权,不具有数据使用权。

    A

    B

  • 2. 从经济社会视角来看,大数据的重点在于“数据量大”。

    A

    B

  • 3. 把句子拆分成一个个词语的过程被称为分词。

    A

    B

  • 4. Hadoop是由Java语言开发的。

    A

    B

  • 5. 启动Hadoop集群服务之前需要格式化文件系统。

    A

    B

  • 1. UMP系统架构设计遵循了以下哪些原则?

    A保持单一的系统对外入口,并且为系统内部维护单一的资源池

    B消除单点故障,保证服务的高可用性

    C保证系统具有良好的可伸缩,能够动态地增加、删减计算与存储节点

    D保证分配给用户的资源也是弹性可伸缩的

  • 2. 下列关于HLog工作原理的描述,哪些是正确的?

    A分布式环境必须要考虑系统出错。HBase采用HLog保证

    BHBase系统为每个Region服务器配置了一个HLog文件

    CZookeeper会实时监测每个Region服务器的状态

    DMaster首先会处理该故障Region服务器上面遗留的HLog文件

  • 3. 针对大型图(比如社交网络和网络图)的计算问题,哪些说法是正确的?

    A为特定的图应用定制相应的分布式实现:通用性不好

    B基于现有的分布式计算平台进行图计算:在性能和易用性方面往往无法达到最优

    C使用单机的图算法库,但是,在可以解决的问题的规模方面具有很大的局限性

    D使用已有的并行图计算系统,但是,对大规模分布式系统非常重要的一些方面(比如容错),无法提供较好的支持

  • 4. HDFS的命名空间包含什么?

    A磁盘

    B文件

    C

    D目录

  • 5. Impala主要由哪几个部分组成:( )

    AImpalad

    BStateStore

    CCLI

    DHive