什么样的人,适合学大数据开发
2018年大数据工程师人均年薪30万
大数据
行业分析
大数据
平台搭建
大数据
开发应用
大数据
可视化
说明:
1.大数据开发所涉及的数据来源于各种不同种类的数据,需要确定数据的输入及产出、数据量,处理效率、可靠性、可维护性
2.大数据开发过程需要明确大数据项目的目标、基于数据做决定、选择使用权、选择合适的数据输出设备
课程设置
课程一阶段
学习目标:
掌握Java流程控制和数组、面向对象、集合框架、异常和泛型和注解、IO流、并发编程等知识。完成项目:
Java多线程模拟多窗口售票,Java集合框架管理。第一阶段主要内容:
初识Java
流程控制与数组
面向对象及方法重载
并发编程
课程二阶段
学习目标:
掌握数据库MySQL和SQL、Maven、Git/SVN、MyBatis/Hibernate、Spring、SSM整合。完成项目:
京东电商网站项目、2048游戏项目、智能图书管理系统。第二阶段主要内容:
数据库MySQL和SQL
Maven、Git/SVN
MyBatis/Hibernate
Spring
课程三阶段
学习目标:
掌握VMWare虚拟机安装和使用、Linux文件系统、Linux文本编辑命令Vim、Linux网络管理等。完成项目:
公司网络拓扑实战、构建企业网站和邮件应用平台、构建服务器管理监控系统。第三阶段主要内容:
VMWare虚拟机安装和使用
Linux文件系统
Linux文本编辑命令Vim
Linux网络管理
课程四阶段
学习目标:
掌握Java编程语言中集合、反射、并发编程、网络编程、设计模式、数据结构和算法等高阶常用。完成项目:
类QQ聊天室、RPC模拟实现。第四阶段主要内容:
集合和排序
反射和设计模式
并发编程/多线程
数据结构
课程五阶段
学习目标:
掌握Common和RPC、HDFS分布式文件系统、MapReduce分布式编程模型、YARN资源调度系统等。完成项目:
微博数据大数据分析项目、用户行为分析项目、精准广告投放项目。第五阶段主要内容:
HDFS分布式文件系统
MapReduce编程模型
YARN资源调度系统
ZooKeeper协调服务
课程六阶段
学习目标:
能够熟练使用Flume分布式数据采集工具、Kafka分布式消息系统、Storm分布式流式计算引擎等。完成项目:
实时处理新数据和更新数据库,处理密集查询并行搜索处理大集合的数据。第六阶段主要内容:
Flume分布式数据采集
Kafka分布式消息系统
Storm流式计算引擎
HBase分布式数据库
课程七阶段
学习目标:
掌握Scala编程语言基础语法、Scala面向对象、Scala函数式编程、Scala的并发编程和Spark的RPC。完成项目:
记录用户行为、统计页面转化率,热门商品及黑名单统计第七阶段主要内容:
Scala编程语言基础语法
Scala面向对象
Scala函数式编程
Scala的并发编程
课程八阶段
学习目标:
熟练使用Spark、Spark Core、Spark内核设计和源码阅读、Spark SQL等进行快速开发。完成项目:
使用Spark处理离线数据、使用SparkStreaming完成实时计算。第八阶段主要内容:
Spark编程开发
Spark Core
Spark SQL
Spark Streaming
课程九阶段
学习目标:
能够掌握ElasticSearch核心概念、安装部署、查询和分析、存储机制等能力。完成项目:
实时索引存储节点,elasticsearch建立索引精准搜索分析。第九阶段主要内容:
ElasticSearch核心概念
ElasticSearch安装部署
ElasticSearch查询和分析
ElasticSearch存储机制
课程十阶段
学习目标:
熟练Flink简介、Flink架构和集群安装、Flink应用案例、Flink原理分析。完成项目:
Kafka对接Flink的消费数据展示及整合、高吞吐。第十阶段主要内容:
Flink简介
Flink架构和集群安装
Flink应用案例
Flink原理分析
课程十一阶段
学习目标:
熟练模型评估与选择,熟练使用机器学习各种算法,掌握机器学习与大数据的结合。完成项目:
广告CTR预估及投放,智能数据实时监测项目社交图谱大数据分析。第十一阶段主要内容:
Python工具库实战
机器学习基础理论概述
机器学习入门
机器学习进阶
课程十二阶段
学习目标:
能够熟练进行版本调优、压缩调优、文件调优、参数调优等八大集群调优。完成项目:
大数据并发超大集群调优,服务器大集群架构调优,超大数据资源调优。第十二阶段主要内容:
JavaSE增强新增课程:网络编程BIO、NIO、Netty
1、网络编程概念和用途;2、网络编程模型概述;3、BIO编程模型案例实现;4、NIO的产生和详述;5、NIO的三大组件详解;6、NIO的编程案例实现;7、Netty的架构详解;8、Netty的应用案例:分布式文件系统实现;Flink精讲新增课程:Flink原理分析
1、Flink调度分析;2、Flink生成执行计划流程分析;3、Flink生成执行计划源码分析;4、JobGraph的生成和源码分析;5、ExcutionGraph的生成和源码分析;6、物理执行图;7、生成消费原理;8、Task的任务分配详解;机器学习新增课程:机器学习进阶
1、数据挖掘详细分析;2、AdaBoost原理详解;3、Aproiri原理详解;4、GBDT原理和SKLearn实现;5、HMM隐马尔可夫模型;6、深度学习神经网络及TensorFlow;7、CNN卷积神经网络详解;8、RNN循环神经网络详解;集合排序
1、Collection体系详解和源码阅读;2、Map体系详解和源码阅读;3、Iterable和Iterator深入详解;4、工具类Collections和Arrays;5、Comparator和Comparable详解;6、15种排序算法概述;7、归并排序,快速排序,堆排序等;8、各种排序算法的优劣对比;反射和设计模式
1、面向对象的终极奥义理解;2、一切皆对象;3、Class,Method,Constructor,Field详解;4、单例和工厂方法模式;5、责任链和策略模式;6、代理设计模式;7、装饰器和适配器设计模式;8、观察者和解释器设计模式;并发编程/多线程
1、进程和线程、并行和并发;2、多线程的实现和状态详解;3、java的内存模型;4、synchronized和lock两种同步方式;5、原子量,volatile,ThreadLocal等;6、JDK1.5的新特性:并发包详解;7、线程池详解;8、Java并发消息队列详解;数据结构
1、数据结构的概念,分类和用途;2、线性表:数组详解;3、线性表:链表详解;4、队列,栈,Hash表详解;5、树详解(平衡树,B树等);6、堆详解(大根堆,小根堆);7、图详解;8、跳表,布隆过滤器等;经典算法
1、算法的概念和表示方式;2、算法的复杂度衡量(空间和时间);3、递推、递归、穷举、迭代、分治;4、贪心、动态规划、分治限界;5、查找算法、加密算法;6、压缩算法、图相关算法;7、一致性Hash算法;8、分布式一致性算法;JVM详解和调优
1、JVM组织架构;2、JVM内存结构;3、JVM各内存区域的概念和作用详解;4、JVM类加载器和自定义类加载器;5、JVM垃圾回收算法;6、JVM垃圾回收器;7、JVM各种参数详解;8、JVM常用调试工具使用总结;Python和爬虫
1、Python编程语言概述;2、Python基础语法;3、Python的集合和函数;4、Python的文件读写;5、爬虫的概念、作用和工作机制;6、第一个爬虫程序;7、requests,beautifulsoup,xpath详细使用;8、scrapy实现爬取拉勾/知乎项目;Hadoop调优
1、版本调优;2、压缩调优;3、文件格式调优;4、参数调优;5、操作系统调优;6、代码调优;7、资源调优;8、架构调优;Spark内核设计和源码阅读
1、SparkContext对象的初始化详解;2、DAGScheduler的初始化和工作职责详解;3、TaskScheduler的初始化和工作职责详解;4、Master角色的启动和工作职责详解;5、Worker角色的启动和工作职责详解;6、Spark应用程序的Stage划分详解;7、Spark应用程序的并行度计算详解;8、Spark任务执行流程的源码解读;Spark GraghX
1、图基本概念介绍;2、图的属性;3、图数据存储;4、图数据库介绍;5、入口案例演示;6、GraghX核心API详解;7、图计算案例演示;8、社交网络潜在好友推荐;Spark MLlib
1、SparkMLlib向量介绍;2、矩阵介绍和常用计算;3、Pipline机器学习流;4、数据的标准化,正则化,缺失值处理;5、L1,L2正则化;6、PCA主成分析、朴素贝叶斯;7、随机森林、逻辑回归;8、推荐系统;ElasticSearch存储机制
1、ES分布式架构、扩容和容错;2、分片&副本分配机制;3、document的核心元数据详解;4、document数据路由原理;5、文档的全量替换;6、ES的延迟删除机制;光环毕业季特惠活动限时开启
18重豪礼等你来领(仅限前100名)项目再次升级:阿里云项目+企业项目+项目案例
基于阿里云MaxCompute计算服务,针对销售行业特定业务模型,分析各类影响数据质量的原因,及各自数据质量的特点和影响,对各类交易数据进行有效监控,并输出数据质量监控报告
基于阿里云分布式计算引擎的机器学习PAI算法平台,利用非结构化处理场景和各种预测场景,以及文本分析与关系挖掘场景,对企业综合数据深度挖掘,全方位精细化为企业提供更准确的营销判断。
基于阿里云DataV,通过图形化的界面轻松搭建天猫双十一专业水准的可视化大屏,可实时监控当日交易支付金额,成交会员分析、热销商品排行等品牌全域核心数据,实现精细化运营。项目四:制作企业级数据分析报表
使用时间序列分析模型,结合DataIDE和机器学习PAI,利用弹性时间序列分解法,根据企业业务数据及企业历史日常交易数据来预测企业后续销售,并根据结果分析来指导企业运营策略。
基于阿里云DataIDE数据管理控制台,将企业各类场景及数据进行同步和开发,能迅速将公司重要业务数据集成展现在公司的管理系统中,为各业务线/各区域的人员提供数据支持。
基于阿里云RecEng系统,对于企业所有用户日志数据,包括离线数据及在线数据,建立基本业务数据模型,根据企业业务特点及用户精准行为分析搭建企业个性化的业务及需求推荐系统。
基于阿里云Quick BI 实战平台,搭建专业级业务数据化运营报表,对用户留存率、活跃率等进行数据报表分析,数据展现丰富,操作便捷,满足企业决策层全程数据的即时分析与即时决策快节奏。
使用服务器容器收集用户访问日志,利用MaxComputer将收集到的海量用户访问日志进行处理分析,使用BI编辑数据并展现分析,根据分析后的结果提出解决方案,为企业提供高价值的策略参考。
该项目使用hadoop分布式爬虫爬取互联网各大电商网站数据,通过各类海量数据的爬行抓取,前台实现实时对数据的快速精准查询和商品对比以及业务分析。
该项目实现对数据系统的高频日志数据进行实时收集和业务处理,在高峰期每秒钟会有近万HTTP请求发送到服务器上,这些请求包含了用户行为和个性化推荐请求。从这些数据中快速挖掘用户兴趣偏 好并作出效果不错的推荐。
通过大数据工具将互联网中的日志采集、清洗、分析统计出常见的互联网指标;开发出各种维度UV的分析报表、各个指标每日、每月指标报表分析,用于对产品做出正确的决策,数据的正确性校对问题,临时性图标的开发。
该项目主要利用hadoop集群强大的计算能力对移动的大批量离线话单数据进行分析,统计移动使用业务(流量套餐、话费套餐、铃声套餐等)情况,达到感知用户行为和使用习惯,确定移动业务推广走向的一套系统。
通过jdbc的方式连接spark的thriftserver,通过集群进行HDFS上的大宽表的运算求count。这样便可以定位相应的客户数量,从而进行客户群、标签的分析,产品的策略匹配从而精准营销。
针对现有技术的缺陷,提供一种基于实时日志的网站威胁检测方法及系统,能够提高日志数据的处理能力及时效性,提高网站威胁检测与反应的及时性,降低网站运行的风险,为网络的信息安全提供有力的保障。
模拟多线程售票窗口
集合框架管理
京东电商仿写项目
智能图书管理系统
类QQ聊天室
RPC模拟实现
公司网络拓扑实战
服务器管理监控系统
微博数据大数据分析
用户行为分析项目
Python微博数据爬取
SSM框架可视化分析
处理新数据和更新数据库
搜索处理大集合数据
使用Spark处理离线数据
讲师团阵容豪华,云集一线业界大咖
班级就业就是讲师水平的最好体现,所有讲师面授教学,薪资同比行业高出3成杨老师
光环大数据专家杨老师光环大数据讲师
工作经历:前全球十大咨询公司ESG亚太区分析师,对云计算、大数据有深入研究,曾为IBM、DELL、HP、EMC等厂商提供产品测评报告,并为国内企业华为、联想、浪潮、曙光等企业的业务现状和发展方向提供战略咨询服务。马老师
光环实战讲师马老师光环实战讲师
工作经历:阿里云/腾讯云认证金牌讲师,阿里云栖大会NLP专场特邀演讲嘉宾,曾任职知名互联网企业甲骨文和光耀东方集团,具备多年大数据技术研发经验,在机器学习算法,自然语言处理方向有深入研究。李老师
光环实战专家李老师光环实战专家
工作经历:阿里云持证讲师,多年Java、大数据技术研发与培训经验,对超级大型集群有深厚的架构调优经验,曾发布《Hadoop实战+超大集群调优》、《Spark全面精讲》等技术视频深受广大学生好评。李老师
光环实战讲师李老师光环实战讲师
工作经历:阿里云持证讲师,对hadoop、hive及hbase等有深入的了解和研究,曾参与多个大型大数据项目开发工作,具有丰富的大数据开发与培训经验,专注于Hadoop生态体系的开发与调优。李老师
光环实战讲师李老师光环实战讲师
工作经历:阿里云持证讲师,毕业于兰州大学·数学与统计学院,信息与计算科学专业,互联网高级软件工程师,曾在某BAT公司任职,多年javaEE、大数据领域研发经验,擅长分布式开发和离线处理、实时计算。高老师
光环高级讲师高老师光环高级讲师
工作经历:清华、北邮大数据及人工智能客座教授,微软亚研院工程师,多年人工智能与大数据处理数据分析经验,曾参与图数据分析引擎GraphView开发,入侵检测机器学习预测项目,SparkMLIib及TensorFlow算法优化。万千就业榜样 下一个高薪会是你吗?
好程序员大数据不以个别就业明星为噱头,每位学员都能通过努力“身价暴涨”平均薪资
【8月】
14660元平均薪资
【7月】
14255元平均薪资
【6月】
15617元平均薪资
【5月】
14548元平均薪资
【4月】
15911元名企合作 就业双选 做教育我们是认真的
我们的学员值得更好的选择阿里云栖大会,光环与阿里云形成战略合作
光环大数据与腾讯云深度合作签约仪式
华为2016全球合作伙伴大会与光环达成战略合作
工匠精神的证明:优秀源于每个值得放大的细节
光环精益求精,引领行业标准,学习流程全方位细节打造,更加科学的培养方案评分标准
满分100分
综合评定学员能力
推荐企业
预计薪酬
光环毕业季特惠活动限时开启
18重豪礼等你来领(仅限前100名)还有顾虑?
0基础能学么?
资金不足怎么办?
能试学吗?
有周末班么?
毕业后好就业么?
毕业从事哪些工作?
毕业能拿多少薪资?
学不会,怎么办?
18年IT培训经验上市机构(股票代码:838504)
累计开设10余种课程培养学员30万+公益讲座覆盖国内98个城市4500余家企业客户
哈尔滨工业大学
东北石油大学
黑龙江外国语大学
北京工业大学
内蒙古民族大学
山西大学
中国石油大学
内蒙古财经大学
太原理工大学
有位老师想和您聊一聊