您的当前位置:首页正文

大数据技术及应用试题库

2023-02-19 来源:好走旅游网
 .

大数据技术及应用题库

单选题:

1从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库

2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫

C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧

3数据仓库的最终目的是(D)。 a. . 收集业务需求

b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析

d. . 为用户和业务部门提供决策支持

4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. . 处理速度快(秒级定律) b. . 算法种类更多 c. . 精度更高 d. . 更加智能化

5大数据的起源是(C)。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理

6大数据不是要教机器像人一样思考。相反,它是(A)。

a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚

7人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

教育资料

.

8数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查

d. . 重复数据记录处理

9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)

A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高

10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据

11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态 c. . 新一代技术平台

d. . 新一代信息技术和服务业态

12万维网之父是(C)

A. 彼得·德鲁克 B. 舍恩伯格

C. 蒂姆·伯纳斯—李 D. 斯科特·布朗

13下列演示方式中,不属于传统统计图方式的是(D)。 A、柱形图 B、饼状图 C、曲线图 D、网络图

14当前社会中,最为突出的大数据环境是(A)。 A、互联网 B、物联网 C、综合国力 D、自然资源

15可以对大数据进行深度分析的工具是(C)。 A、浅层神经网络

教育资料

.

B、Scala C、深度学习 D、MapReduce

16大数据的起源是(C)。 A、金融 B、电信 C、互联网 D、公共管理

17智慧城市的构建,不包含(C)。 A、数字城市 B、物联网 C、联网监控 D、云计算

18大数据的4V特征中的Volume是指(D)。 A、价值密度低 B、处理速度快 C、数据类型繁多 D、数据体量巨大

19大数据的4V特征中的Variety是指(C)。 A、价值密度低 B、处理速度快 C、数据类型繁多 D、数据体量巨大

20大数据的4V特征中的Velocity是指(B)。 A、价值密度低 B、处理速度快 C、数据类型繁多 D、数据体量巨大

21下列关于大数据的分析理念的说法中,错误的是(D)。 A、在数据基础上倾向于全体数据而不是抽样数据 B、在分析方法上更注重相关分析而不是因果分析 C、在分析效果上更追究效率而不是绝对精确 D、在数据规模上强调相对数据而不是绝对数据

22大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(B)。

A、数据信息

教育资料

.

B、专业化处理 C、速度处理 D、内容处理

23大数据的核心就是(B)。 A、告知与许可 B、预测 C、匿名化 D、规模化

24人与人之间沟通信息、传递信息的技术,这指的是(D)。 A、感测技术 B、微电子技术 C、计算机技术 D、通信技术

25大数据的最显著特征是(A)。 A、数据规模大 B、数据类型多样 C、数据处理速度快 D、数据价值密度高

28大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。 A、新一代信息技术 B、新一代服务业态 C、新一代技术平台

D、新一代信息技术和服务业态

29 下列关于普查的缺点的说法中,正确的是(A)。 A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B. 误差不易被控制

C. 对样本的依赖性比较强 D. 评测结果不够稳定

30 下列关于聚类挖掘技术的说法中,错误的是(B)

A不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B需求同类数据的内容相似度尽可能小 C要求不同类数据的内容相似度尽可能小

D与分类挖掘技术相似的是,都是要对数据进行分类处理

31假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。 A因果;相关 B相关;因果

教育资料

.

C并列;相关 D因果;并列

32下列关于数据交易市场的说法中,错误的是(C) A数据交易市场是大数据产业发展到一定程度的产物

B商业化的数据交易活动催生了多方参与的第三方数据交易市场

C数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D数据交易市场是大数据资源化的必然产物

33下列关于计算机存储容量单位的说法中,错误的是(C) A 1KB<1MB<1GB

B 基本单位是字节(Byte)

C 一个汉字需要一个字节的存储空间 D 一个字节能够容纳一个英文字符

34当前大数据技术的基础是由(C)首先提出的 A微软 B百度 C谷歌 D阿里巴巴

35下列国家的大数据发展行动中,集中体现“重视基础,首度先行”的国家是(D) A美国 B日本 C中国 D韩国

36可以对大数据进行深度分析的平台工具是(C) A传统的机器学习和数据分析工具 B第二代机器学习工具 C第三代机器学习工具 D未来机器学习工具

37智能健康手环的应用开发,体现了(D)的数据采集技术的应用 A统计报表 B网络爬虫 C API接口 D传感器

38过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C) A数据清洗 B数据融合 C数据规约 D数据挖掘

39制成大数据业务的基础是(A)

A数据科学 B数据应用 C数据硬件 D数据人才

40面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A) A大数据解决方案模式 B大数据信息分类模式 C大数据处理服务模式

教育资料

.

D大数据资源提供模式

41美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B) A在数据基础上倾向于全体数据而不是抽样数据 B在分析方法上更注重相关分析而不是因果分析 C在分析效果上更追究效率而不是绝对精确 D在数据规模上强调相对数据而不是绝对数据

42根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C) A数据管理人员 B数据分析员 C研究科学家 D软件开发工程师

43.(D)反映数据的精细化程度,越细化的数据,价值越高。 A规模 B活性 C关联度 D颗粒度

44.下列关于数据重组的说法中,错误的是(A) A数据重组是数据的重新产生和重新采集 B数据重组能够使数据焕发新的光芒

C数据重组实现的关键在于多源数据融合和数据集成 D数据重组有利于实现新颖的数据模式创新

45 在数据生命周期管理实践中,(B)是执行方法。 A数据存储和备份规范 B数据管理和维护 C数据价值发觉和利用 D数据应用开发和管理

46 下列关于网络用户行为的说法中,错误的是(C) A网络公司能够捕捉到用户在其网站上的所有行为

B用户离散的交互痕迹能够为企业提升服务质量提供参考 C数字轨迹用完即自动删除

D用户的隐私安全很难得以规范保护

47 Mac OS系统的开发者是(C) A微软公司 B惠普公司 C苹果公司

教育资料

.

DIBM公司

48 大数据时代,数据使用的关键是(D) A数据收集 B数据存储 C数据分析 D数据再利用

49 下列关于数据交易市场的说法中,错误的是(C) A数据交易市场是大数据产业发展到一定程度的产物

B商业化的数据交易活动催生了多方参与的第三方数据交易市场

C数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D数据交易市场是大数据资源化的必然产物

50 下列论据中,能够支撑“大数据无所不能”的观点的是(A) A互联网金融打破了传统的观念和行为 B大数据存在泡沫

C大数据具有非常高的成本 D个人隐私泄露与信息安全担忧

51数据仓库的最终目的是(D) A收集业务需求

B建立数据仓库逻辑模型 C开发数据仓库的应用分析

D为用户和业务部门提供决策支持

52 支撑大数据业务的基础是(B) A数据科学 B数据应用 C数据硬件 D数据人才

53、 下列关于大数据预测的说法中,错误的是(D) A人类的生活正在被大数据预测深刻改变 B预测性分析是大数据最核心的功能

C分析从“面向已经发生的过去”转向“面向即将发生的未来”是大数据与传统数据的最大区别

D大数据预测则是基本大数据和预测模型去预测过去某件事情的概率

54、一切事物及事物运动的状态,不仅销售数据、价格这些客观标准可以形成大数据,甚至连顾客情绪(如色彩、空间的感知等)都可以测得,这体现了大数据思维维度中的(A) A定量思维 B相关思维 C因果思维

教育资料

.

D实验思维

55、下列国家的大数据发展行动中,坚持原则先行、谨慎发展的国家是(D) A英国 B韩国 C印度 D澳大利亚

56、下列论据中,体现“冷眼”看大数据的观点是(B) A互联网金融打破了传统的观念和行为 B大数据医疗正在走**民百姓 C数据资产型企业前景光明 D个人隐私泄露与信息安全担忧

57、下列国家的大数据发展行动中,视大数据为新的自然资源的国家是(D) A中国 B韩国 C印度 D新加坡

58、大数据环境下的隐私担忧,主要表现为(A) A个人信息的被识别与暴露 B用户画像的生成 C恶意广告的推送 D病毒侵入

59、对线下零售而言,做好大数据分析应用的前提是(C) A增加统计种类 B扩大营业面积 C增加数据来源 D开展优惠促销

60、万维网的实施国家是(B) A英国 B美国 C德国 D印度

61、一切皆可试,大数据分析的效果好坏,可能通过模拟仿真或者实际运行来验证,这体现大数据思维中的(D) A定量思维 B相关思维 C因果思维 D实验思维

教育资料

.

62、下列企业中,最有可能成为典型的数据资产运营商的是(D) A物联网企业 B互联网企业 C云计算企业 D电信运营商 多选题:

1云计算的优势体现在以下哪些方面?(ABCD) a. . 云计算服务更加安全可靠 b. . 云计算可以真正实现按需服务 c. . 云计算可以有效提高资源利用率 d. . 云计算可以大大降低成本和能耗

2医疗领域如何利用大数据?(ABCD) a. . 临床决策支持 b. . 个性化医疗 c. . 社保资金安全 d. . 用户行为分析

3下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)。 A. 日本:走尖端IT路线

B. 英国:视大数据为新的自然资源 C. 韩国:重视基础、首都先行 D 印度:以IT外包转型为突破口 E 澳大利亚:原则先行,谨慎发展

4 当前,大数据产业发展的特点是(BCE) A规模较大 B规模较小 C增速很快 D增速缓慢

E 多产业交叉融合

5 下列关于发数据的说法中,错误的是(AD) A大数据具有体量大、结构单一、时效性强的特征

B处理大数据需采用新型计算机架构和智能算法等新技术 C大数据的应有注重相关分析而不是因果分析 D大数据的应有注重因果分析而不是相关分析

E大数据的目的在于发现新的知识与洞察并进行科学决策

6 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(ABC) A传统营销模式比基于大数据的营销模式投入更小 B传统营销模式比基于大数据的营销模式针对性更强

教育资料

.

C传统营销模式比基于大数据的营销模式转化率低 D基于大数据的营销模式比传统营销模式实时性更强 E基于大数据的营销模式比传统营销模式标准性更强

7 按照服务目的不同,数据流通平台可分为(CDE) A政府数据开放平台 B企业数据开放平台 C数据交易市场 D数据研发市场 E数据废弃交易市场

8 下列论据中,能够支撑“大数据唔多不能”的观点的是(ADE) A互联网金融打破了传统的观念和行为 B大数据存在泡沫

C大数据具有非常高的成本 D大数据医疗正在走**民百姓 E数据资产型企业前景光明

9 大数据的价值体现在(ABCDE) A大数据给思维方式带来了冲击 B大数据为政策制定提供科学依据

C大数据助力智慧城市提升公共服务水平 D大数据实现了精准营销 E大数据的发力点在于预测

10 当前大数据技术的基础包括(ABD) A分布式文件系统 B分布式并行计算 C关系型数据库 D分布式数据库 E非关系型数据库

11 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是(BD) A能够直观反映成对数据之间的空间关系 B能够主观反映多维数据之间的空间关系 C能够静态演化事物的变化及变化的规律 D能够动态演化事物的变化及变化的规律

12 下列关于计算机存贮容量单位换算关系的公式中,正确的是(BE) A. 1KB=1012Byte B. 1KB=1024Bytes C. 1GB=1024KB D. 1GB=1012MB E. 1GB=1024MB

教育资料

.

13、在网络爬虫的爬行策略中,应用最为基础的是(AB) A深度优先遍历策略 B广度优先遍历策略 C高度优先遍历策略 D反向链接策略 E大战优先策略

14、当前,大数据产业发展的特点是(ACE) A规模较大 B规模较小 C增速很快 D增速缓慢

E多产业交叉融合

15、下列关于数据生命周期管理的核心认识中,正确的是(ABC) A数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段 B在不同的数据存在阶段,数据的价值是不同的

C根据数据价值的不同应该对数据采取不同的管路策略 D数据生命周期管理旨在产生效益的同时,降低生产成本 E数据生命周期管理最终关注的是社会效益

16、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(AB) A传统营销模式比基于大数据的营销模式投入更小 B传统营销模式比基于大数据的营销模式针对性更强 C传统营销模式比基于大数据的营销模式转化率低 D基于大数据的营销模式比传统营销模式实时性更强 E基于大数据的营销模式比传统营销模式精准性更强

17、下列关于脏数据的说法中,正确的是(ABCDE) A格式不规范 B编码不统一 C意义不明确

D与实际业务关系不大 E数据不完整

18、数据再利用的意义在于(ABC) A挖掘数据的潜在价值

B实现数据重组的创新价值

C利用数据可扩展性拓宽业务领域 D优化存储设备,降低设备成本 E提高社会效益,优化社会管理

19、按照涉及自变量的多少,可以将回归分析分为(CD)

教育资料

.

A线性回归分析 B非线性回归分析 C一元回归分析 D多元回归分析 E综合回归分析

20、传统数据密集型行业积极探索和布局大数据应用的表现是(BCE) A投资入股互联网电商行业 B打通多源跨域数据 C提高分析挖掘能力 D自行开发数据产品 E实现科学决策与运营

21、大数据人才整体上需要具备(ABE)等核心知识。 A数学与统计知识 B计算机相关知识 C马克思主义哲学知识 D市场运营管理知识 E在特定业务领域的知识

22、下列关于大数据的说法中,错误的是(AD) A大数据具有体量大、结构单一、时效性强的特征 B处理大数据需采用新型计算架构和智能算法等新技术 C大数据的应用注重相关分析而不是因果分析 D大数据的应用注重因果分析而不是相关分析

E大数据的目的在于发现新的知识与洞察并进行科学决策

23、下列关于大数据对政府政策制定的影响的说法中,错误的是(CD) A大数据有助于避免传统决策方式的随意性和主观性 B大数据有效改变了政府的决策方式

C大数据可以完美解决一切政府政策制定难题

D大数据推动政府从基于“实证”的决策模式走向基于“经验”的决策模式 E大数据拓展了政府决策的信息边界条件

24、当前大数据技术的基础包括(ABD) A分布式文件系统 B分布式并行计算 C关系型数据库 D分布式数据库 E非关系型数据库

25、大数据的低耗能能存储及高效率计算的要求,需要以下多种技术协同合作(ABCD) A分布式云存储技术 B高性能并行计算技术

教育资料

.

C多元数据清洗及数据整合技术

D分布式文件系统及分布式并行数据库 E可视化高维展示技术

26、IBM公司用3个V来描述大数据的三个基本特征,这3V是(ACD) A体量 B规模 C速度 D多样性 E复杂性

27、可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是(BD) A能够直观反映成对数据之间的空间关系 B能够主观反映多维数据之间的空间关系 C能够静态演化事物的变化及变化的规律 D能够动态演化事物的变化及变化的规律

28、下列关于云计算和数据库的说法中,错误的是(AE) A获取样本的代价很高

B获取足够大的样本数据乃至全体数据非常容易 C比抽样调查数据更全面

D比抽样调查更能反映整个群体的特征与规律 E可以为发现新的商机机会提供决策支持

判断题:

1 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务云服务形式为用户提供自己的数据上传到服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果。(√)

2. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息精确。(×) 3. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同最好集中处理。(×)

4. 在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国、英国、加拿大、荷兰在内的五个国家。(√)

5. 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(×) 6.当前,企业提供的大数据解决方案大多基于Ha doop开源项目。(√)

7. 澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府。(√)

8. 大数据可以分析与挖掘出之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。(√) 9.数据资产型企业产品线的盈利,主要通过提供收费服务来获取。(√)

10.在大数据的范畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行为特征,充分挖掘大数据的价值,变数据为资产。(×)

11 在噪声数据中,波动数据比离群点数据偏离整体水平更大。(×)

教育资料

.

12、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(√) 13、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(×)

14、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。(×)

15、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。(√) 16、信息生命周期管理是根据生命周期管理的来源,最早由英国企业提出。(×)

17、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。(×) 18、利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展示的,大大解决政府决策的科学性。(√)

19、在新加坡政府发展大数据的行动中,政府侧重于做好数据分析和服务,不承担数据提供服务。(×)

20、人们关心大数据,最终是关心大数据的应用,关心如何从业务和应用出发让大数据真正实现其蕴含的价值,从而为人们的生产生活带来有益的改变。(√) 21、从经济社会视角来看,大数据的重点在于“数据量大”。(×)

教育资料

因篇幅问题不能全部显示,请点此查看更多更全内容