光环国际大数据测试题
考试范围 考试时间 Java、Python、云计算、大数据 120分钟 满分: 出卷人: 100分 姓名_______ 成绩________
一、单选题(每题2分,共15题)
1、当前大数据技术的基础是由( )首先提出的
A. 微软 B. 百度 C. 谷歌 D. 阿里巴巴 2、大数据的起源是( )
A. 金融 B. 电信 C. 互联网 D. 公共管理 3、( )反映数据的精细化程度,越细化的数据,价值越高。 A. 规模 B. 活性 C. 关联度 D. 颗粒度 4、数据清洗的方法不包括( )
A. 缺失值处理 B. 噪声数据清除
C. 一致性检查 D. 重复数据记录处理
5、当程序经过编译或者汇编以后,形成了一种由机器指令组成的集合,被称为( )
A. 源程序 B. 目标程序 C. 可执行程序 D. 非执行程序
6、大数据的核心就是( ) A. 告知与许可
B. 预测 C. 匿名化 D. 规模化
7、大数据不是要教机器像人一样思考。相反,它是( )
A. 把数学算法运用到海量的数据上来预测事情发生的可能性。 B. 被视为人工智能的一部分 C. 被视为一种机器学习 D. 预测与惩罚
8、当前社会中,最为突出的大数据环境是( )
A.互联网 B.物联网 C.综合国力 D.自然资源 9、以下哪些技术为大数据常用框架或技术(多选)( )。
A.Hadoop B.Spark C.Hbase D.Linux 10、云计算按照服务类型大致可分为以下类(多选)( )
A.IaaS B.PaaS C.SaaS D.效用计算
1
大数据测试
11、下列哪个语句在Python中是非法的?( )
A.x=y=z=1 B.x=(y=z+1) C.x,y=y,x D.x+=y
12、关于数据的潜在价值,说法正确的是(多选)( )
A. 数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角, 而绝大部分则隐藏在表面之下。
B. 判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考 虑其目前的用途。
C. 在基本用途完成后,数据的价值仍然存在,只是处于休眠状态 D. 数据的价值是其所有可能用途的总和 13、下列不是Java语言面向对象的特点( )
A. 封装 B.继承 C.跨平台 D.多态 14、大数据人才整体上需要具备(多选)( )等核心知识
A. 数学与统计知识 B. 计算机相关知识 C. 马克思主义哲学知识 D. 市场运营管理知识
15、观察下图,其中问号选择()
16、在Python中,下列哪种说法是错误的 ( D )
A、除字典类型外,所有标准对象均可以用于布尔测试 B、空字符串的布尔值是False C、空列表对象的布尔值是False
D、值为0的任何数字对象的布尔值是False 17、ArrayList类的底层数据结构是( A )
A、数组结构 B、链表结构 C、哈希表结构 D、红黑树结构
18、Java中覆盖与重载的关系是:( A )。
A、覆盖只有发生在父类与子类之间,而重载可以发生在同一个类中 B、覆盖方法可以不同名,而重载方法必须同名 C、final修饰的方法可以被覆盖,但不能被重载 D、覆盖与重载是同一回事
19、下面关于进程、线程的说法不正确的是( C )。
A、进程是程序的一次动态执行过程。一个进程在其执行过程中,可以产生 多个线程——多线程,形成多条执行线索。
B、线程是比进程更小的执行单位,是在一个进程中独立的控制流,即程序 内部的控制流。线程本身不能自动运行,栖身于某个进程之中,由进程
2
大数据测试
启动执行。
C、Java多线程的运行与平台无关。 D、 对于单处理器系统,多个线程分时间片获取CPU或其他系统资源来运行。 对于多处理器系统,线程可以分配到多个处理器中,从而真正的并发执 行多任务。
20、请问下列哪些类是定义在java.io包中的抽象类( ABD ) (多选)
A. InputStream B. OutputStream C. PrintStream D. Reader
E. FileInputStream F. FileWriter
二、填空题(共10题,每题2分)
16、数据库的三大范式______、______、______
17、Linux下__________________命令把某一个文件下的所有的文件分发到其他的机器上。
18、Linux用_______命令查看cpu,硬盘,内存的信息。 19、Java的三大体系分别是______、______、______
20、Java中的变量可分为两种数据类型,分别是______和______。
21、在java中,byte类型数组占_____个字节,short类型数据占____个字节,int类型数据占____个字节,long类型数据占____个字节
22、Python中的可变数据类型有_______,不可变数据类 型有_________ 。 23、Python提供了两个对象身份比较操作符_____和______来测试两个变量是否指向同一个对象,也可以通过内建函数_______来测试对象的类型。 24、队列的实现是_______,消费的顺序是________。
25、hadoop的角色中_______负责管理元数据信息、________做namenode冷备份、________主要做储存数据的、_________管理任务、_________执行任务。
三、判断题(每题1分,共10题)
26、数据化就是数字化,是相互等同的关系。( )
27、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。( ) 28、对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大。( )
29、大数据的核心思想就是用规模剧增来改变现状。( )
30、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的 数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上 的可扩展性等特点。( )
31、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此, 大数据收集的信息量要尽量精确。( )
32、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这 些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的 概率可能会有差异。( ) 33、大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事 件必然会发生。( )
34、Java 和 c都是面向对象的程序设计语言。( )
3
大数据测试
35、Hadoop 支持数据的随机读写。( )
36、Java 静态初始化器是在其所属的类对象实例化时由系统自动调用执行。 ( F )
37、Java 线程间通信可通过共享数据使线程互相交流,也可通过线程控制方法使线程互相等待。 ( T )
38、在Python中除字典类型外,所有标准对象均可以用于布尔测试 ( T ) 39、40XL是Python合法的标识符( F )
40、Java中map集合的value值可以重复 ( T )
四、问答题(每题10分,共4题)
36、简述大数据技术的特点。
37、说下你理解的大数据,以及知道的大数据相关的一些技术和框架;谈谈你对hadoop 的一些理解,包括哪些组件。
38、明一家过一座桥,过桥时是黑夜,所以必须有灯。现在小明过桥要1秒,小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要8秒,小明的爷爷要12秒。每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30秒就会熄灭。问:小明一家如何过桥
39、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份?
40、多线程实现交替打印1到20?
41、写出你所知道的所有能遍历list和map集合的方法
42、一行把[1,2,3,1,2,3] 中的重复元素剔除。
4
因篇幅问题不能全部显示,请点此查看更多更全内容