工作岗位大数据运维工程师大数据分析挖掘师大数据开发工程师数据可视化工程师大数据平台工程师大数据项目经理大数据售前顾问表1 大数据技术专业面向的主要岗位及职业能力要求主要职业能力1.负责运维大数据平台解决方案的制定、设计和实施;2.HDFS、Yarn、spark、kafka、habse、ELK等生态组件的落地实践。1.熟悉数据模型设计方法,熟练掌握SQL语言、R、Python等一种或一种以上的分析工具;2.熟悉数据挖掘过程,具备独立完成数据抽取、数据处理等任务的能力。1.掌握流式实时计算分析和离线数据统计分析;2.掌握的主要编程语言为Scala/Java/Python。1.负责对用户所需的大数据产品进行可视化设计与开发;2.熟 练 掌 握 Web 前 端 技术和各种编程语言;3.熟悉Tableau、Echarts等可视化工具。1.掌握分布式系统原理,对存储、计算、消息队列、集群管理中的一项或多项有深入的理解和认识;2.熟悉多项大数据处理/分析相关的工具/框架。1.负责大数据产品的规划、宣传和产品推广;2.负责业务文档的编写、业务原型的开发,从业务角度确认产品的正确性。1.熟悉Hadoop相关技术,包括HDFS、MapReduce、HBase、Spark、Hive等;2.良好的表达沟通能力,良好的方案编写、讲解与演讲能力。表2 职业院校技能大赛大数据技术与应用赛项技能要求类别大数据运维部署类大数据应用开发类大数据市场营销类序号123456模块名称大数据平台搭建(容器环境)离线数据处理数据挖掘数据采集与实时计算数据可视化综合分析知识技能要求依据大数据平台的技术特点独立解压、安装、配置。对不同的组件进行文件参数配置、状态查看、服务启动、组件部署等。利用Java、Scala开发语言,对关系型数据库中的离线存量数据进行全量数据抽取、增量数据抽取,将数据存入Hive数据仓库,完成数据清洗等工作。利用Scala开发语言,基于Spark ML机器学习库,根据既有数据完成数据处理建立数据模型完成数据分析等工作。基于Flume、Kafka组件对实时数据进行采集传输,利用 Flink消费实时数据进行相关的数据指标计算等工作。Scala开发语言,使用对数据进行可视化展示,利用前端框架Vue.js以及数据可视化图表组件ECharts,将数据分析结果以柱状图、饼图、条形图等图表进行展示。依据数据挖掘分析结果,在综合理解业务数据的基础上,根据题目要求进行分析,并编写输出分析报告。知识内容,强化学生实践动手能力。整个课程实践内容包含Hadoop环境搭建、HDFS读写操作、使用MapReduce进行批量数据处理、Hive数据仓库运用等部分,具体安排如表5所示。8 结束语以“岗课赛证”融合的形式为导向对大数据专业课程进行改革实践,将大数据相关岗位工作任务、职业院校技能大赛能力要求和星环信息公司的大数据平台管理与开发“1+X”证书认证考核的内容及要求,融入我校大数据技术专业课程体系设置和课程教学过程中,提升本专业学生的专业知识技能和综合职业素养,使学生更贴合市场人才需求。使我校的大数据技术专业建设和人才培养更上一层楼,培养出社会需要的高素质复合型技术技能人才。20日,教育部发布的与大数据专业相关的1+X职业技能等级证书有大数据分析与应用职业技能等级证书、数据采集职业技能等级证书等。5.2 大数据平台管理与开发中级1+X证书星环信息科技(上海)有限公司大数据平台管理与开发中级1+X职业技能等级证书和我校大数据技术专业人才培养方向较为匹配。以此证书中级认证标准作为我校大数据专业课程改革实践的参考标准。其认证标准如表3所示。6 大数据技术专业的专业课程设置根据上文从“岗赛证”三个方面的技能分析且结合我校的培养目标,笔者归纳整理了我校大数据技术专业应该开设的专业课程,如表4所示。7 大数据专业核心专业课程改革实践Hadoop大数据开发技术是大数据技术专业的核心课程,属于必修课。本课程主要是通过“教、学、做”一体化教学,将教学内容融入实际项目中,在实践过程中分解2023.2(上)知识文库131
工作任务表3 星环信息科技“大数据平台管理与开发中级1+X”认证标准认证要求大数据平台服务器管理Hadoop组件维护管理Hive组件维护管理HBase组件维护管理SQL数据分析开发Hive组件开发大数据平台组件维护管理大数据组件开发HBase组件开发MapReduce组件开发Spark开发Sqoop工具开发大数据ETL工具开发Flume工具开发KafKa工具开发课程类别课程性质专业基本能力类课程专业必修专业核心能力类课程专业必修专业拓展能力类课程(专业方向选修)专业选修表4 专业课程设置课程名称计算机网络基础C语言程序设计Python程序设计MySQL数据库网页设计与制作大数据导论Java程序设计Linux 操作系统数据采集技术与应用Hadoop技术与应用Spark项目开发技术数据可视化技术大数据系统运维Web后端开发技术数据仓库与数据挖掘技术操作系统与数据安全服务器维护管理表5 《Hadoop技术与应用》教学内容安排学期11222123333444444序号1234567
学习单元Hadoop集群部署HDFS基础操作HBase数据库的安装与应用MapReduce应用开发Hive数据仓库Flume和Sqoop的安装与使用
数据可视化技术
知识目标
1.掌握Hadoop的安装;2.掌握Hadoop的配置;
3.掌握Hadoop的启动和Web监控;4.掌握Wordcount实例。1.了解HDFS的相关概念;2.掌握HDFS的工作原理;3.掌握HDFS的Shell操作;4.掌握HDFS中API编程。
1.熟悉HBase逻辑视图、概念视图和物理视图的关系;2.掌握HBase体系架构;3.掌握HBase Shell常用命令;4.掌握HBase API编程。1.了解MapReduce的概念;2.掌握MapReduce编程模型;3.掌握MapReduce数据类型;4.掌握MapReduce环境的配置。1.了解Hive架构及组件;2.掌握Hive系统安装配置;
3.掌握Hive创建数据库和表;4.掌握Hive数据的导入和导出。1.掌握Flume安装配置;2.掌握Flume日志采集;
3.掌握Sqoop安装配置;4.掌握Sqoop与Hadoop数据导入导出。
1.了解数据可视化常用工具;2.掌握Echart绘制图表的方法和步骤;3.掌握Echart绘制气温变化图;4.掌握Echart绘制网站访问来源统计图。
(作者单位:贵州航空职业技术学院)132知识文库2023.2(上)
因篇幅问题不能全部显示,请点此查看更多更全内容