8次课程迭代,519个知识点更新,1120个课时
大数据分析课程为光环大数据研发课程,所以公开课程模块不公开详细课程
宗旨: 光环大数据自成立起,紧跟行业发展趋势和企业需求,每1-2月升级完善课程,定期访问名企及已就业学员,确保课程前沿、专业、实用!
课程价值: 呕心沥血,打造精良课程体系!
- 阶段一Excel传统数据分析
- 阶段二基于Excel的SmartBI开发
- 阶段三数据存储之MySQL
- 阶段四数据存储之Oracle
- 阶段五Python语言 / 数据科学
- 阶段六机器学习
- 阶段七深度学习
- 阶段八自然语言处理
- 阶段九R数据分析
- 阶段十数学基础
- 阶段十一R语言数据挖掘
- 阶段十二Echarts
- 阶段十三可视化开发框架D3
- 阶段十四SPSS Modeler数据挖掘
- 阶段十五数据采集和处理-爬虫
- 阶段十六数据采集和处理Kettle
- 阶段十七数据采集和处理Informatica
- 阶段十八大数据离线分析平台
- 阶段十九大数据数据仓库-Hive
- 阶段二十商业智能与可视化-Tableau
- 阶段二十一商业智能与可视化-帆软 查看完整课程大纲
课程内容
学习目标:
掌握Excel的基本操作;能使用Excel做数据清洗和筛选;使用Excel图表、VBA高级编程方式做数据分析和预测等。完成项目:
药品原料配比成本分析、院校大赛评比成绩分析。主要内容:
-
数据分析流程讲解
数据来源简介
数据清洗方法
单元格格式设置
数据处理
-
数据分析
数据分类
数据导入
保护工作表
高级筛选操作
-
数据验证方式
应用批注
合并计算汇总
合并计算之模拟运算
合并计算之去重
-
合并计算之多种计算
简单函数的介绍
逻辑函数
闰年的判断
文本函数
课程内容(选修)
学习目标:
掌握SmartBI电子表格巧妙利用Excel自身的表格、图形、函数的能力,就能够实现各种BI应用,还可将报表一键发布到Web/APP端进行浏览完成项目:
SmartBI商务智能平台项目、奥迪BI客户分析项目主要内容:
-
smartBI概述
smartBI安装
smartBI导入数据源
smartBI导入Excel
-
smartBI清单列表
smartBI参数
smartBI抽取
smartBI用户组
-
smartBI角色
smartBI权限
smartBI资源发布
smartBI生成报告
课程内容
学习目标:
本课程学习可以熟悉数据库原理;Mysql数据库的语法和使用技巧。完成项目:
MySQL索引、MySQL视图。主要内容:
-
数据存储的应用
数据库理论
备份数据库及还原
数据类型
显示表结构
-
Insert语句
Delete及Turncate区别
Select基本语句
模糊查询
聚合函数
-
case when语句
日期函数
笛卡尔基连接
Exists子查询
Union联合查询
-
索引概述
复制结构及蠕虫复制
单表及多表视图
视图与原表之间关系
视图的运算规则
课程内容
学习目标:
本课程学习可以掌握oracle数据库的语法和使用技巧。企业真实项目,真实需求和实战体验oracle数据库在数据分析项目中的使用和价值完成项目:
企业ERP系统数据库设计、ERP手机进销存主要内容:
-
oracle数据库基本操作
oracle函数
oracle高级查询
oracle高级对象之序列
oracle存储之分区
-
oracle管理之用户
oracle权限分配
高级编程-PLSQL
高级编程-游标
存储过程
-
存储过程
oracle高级编程-函数
oracle高级编程-触发器
oracle递归
分析函数
-
oracle高级编程-job
oracle高级编程-优化
oracle项目实战
课程内容
学习目标:
该课程主要讲解python数据处理和分析的库的使用,实现数据计算,统计,和可视化完成项目:
计算器程序设计开发、通过Numpy进行图像处理主要内容:
-
python语法基础
Python数据类型
Python流程控制
python函数
python模块
-
python的文件处理
python数据分析环境配置
python数据分析环境部署
Numpy基本概念
Numpy数据类型
-
Numpy通用函数
Numpy数据类型
Pandas基本使用
与Numpy相关操作
Numpy的创建与使用
-
Matplotlib使用和实践
索引与值的排序
相关统计函数
数组的多种创建方式
花式索引与布尔索引
课程内容(选修)
学习目标:
主流机器学习框架介绍,针对机器学习场景能够更好的应用相关工具进行分析与处理。完成项目:
贷款风险评估预测、Facebook营销组合分类主要内容:
-
机器学习概念详解
有监督学习
无监督学习
分类/聚类
KNN
-
朴素贝叶斯
集成学习
决策树
线性回归
随机森林
-
损失函数
最小二乘法
梯度下降
逻辑回归
K-Means
-
SVM支持向量机
课程内容(选修)
学习目标:
该课程学习深度学习的基本概念,知识点连接以及外延知识介绍。完成项目:
网络相册图像分类、验证码只能识别主要内容:
-
神经网络结构
滤波器
卷积池化
激活函数
-
反向传播
目标分类与识别
目标检测与追踪
AlexNet
-
VGGNet
GoogleLeNet
Inception-V3/V4
ResNet
-
DenseNet
RNN基本原理
课程内容(选修)
学习目标:
讲解NLP 自然语言处理相关知识点及相应主流处理技术。完成项目:
影视评论情感分析、网络新闻分类、简历相似度匹配主要内容:
-
分词、停用词过滤
词干提取
词形还原
词袋模型
TF-IDF
-
Word2Vec
自然语言处理实战-情感分析
课程内容(选修)
学习目标:
R语言基础与数据分析:R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。完成项目:
汽车销售数据分析主要内容:
-
R语言安装
基本语法
选择结构
循环结构
-
数据类型详解
函数
导入外部数据
常见图形的制作
-
echarts包的使用1
echarts包的使用2
课程内容
学习目标:
学习概率基础和统计基础两部分内容。完成项目:
独立试验概型、抽样分布主要内容:
-
基本概念
概率的定义
条件概率
贝叶斯公式
-
独立试验概型
随机变量及其分布
随机变量及其数字特征
相关性
-
中心极限定理
统计基础概念
抽样分布
点估计
-
区间估计
随机事件
排列组合
总体和样本
课程内容(选修)
学习目标:
数据挖掘正在改变着企业和其他大型组织与客户的互动方式,大量的数据正在很好地用于预测客户行为和结果。完成项目:
主要内容:
-
数据集处理
数据集类型
使用R处理数据集
R的数据管理
-
R数据预处理
数据的输入
变量管理
数据集变换
-
聚集和抽样
维归约和特征子集
特征创建
离散化、二元化
-
可视化分析
描述性分析
变量相关
独立性分析
课程内容(选修)
学习目标:
北京市2016-2017年度二手房交易分析、Echarts大数据可视化分析完成项目:
echarts实战-旅游行业主要内容:
-
各种可视化图标的实现
折线图、柱形图、饼图
散点图、雷达图、面积图
区域地图、标点地图
流线地图、百度地图
-
R语言之运算符
选择语句
循环语句
循环控制语句
字符串、向量
-
热力图:热力地图
笛卡尔积热力图
矩形树图、销售漏斗
K线图、箱线图
象形柱图
-
桑基图、主题河流图
关系图、日历图
echarts实战-旅游行业
课程内容(选修)
学习目标:
史上最专业的可视化开发框架,效果繁多,组建灵活,只有你想不到,没有它办不到,它被视为js 可视化框架的鼻祖楷模,可以让使用者以数据驱动的方式操作DOM完成项目:
数据可视化职位分析、国内汽车大数据可视化项目主要内容:
-
D3数组与Map
SET与数据绑定
D3比例尺与坐标轴
D3插值方法
-
D3选择元素
D3对数据的过滤
D3为元素绑定数据
绘制散点图
-
动画过渡
D3定时器
D3触屏
拖拽和缩放
-
JSON/CSV数据
TXT数据集SVG导出
D3高保真设计
D3实战-可视化职位分析
课程内容
学习目标:
IBM SPSS Modeler 是一个专门的数据挖掘工具,它是用来建立预测模型和进行其他分析任务的。其可视化界面允许用户利用统计和数据挖掘算法完成项目:
员工绩效管理、信用行为特征分析主要内容:
-
描述性统计
统计量及其抽样分布
卡方检验,假设验证
相关分析
-
线性、曲线回归
决策树
评估分类器
聚类分析
-
集成学习
神经网络
员工绩效管理
信用行为特征分类
-
降维在消费行为应用
用户行为画像
生成分析报告
客户价值评分
课程内容
学习目标:
大数据时代的到来预示着数据越来越具有价值,作为采集数据最有效的方式该课程用不同技术实现网络爬虫以获取互联网数据。完成项目:
58同城数据爬取、赶集网数据爬取主要内容:
-
爬虫介绍
网络基础知识
web基础
基于python网络爬虫
-
基于R网路爬虫
基于工具网络爬虫
课程内容
学习目标:
Kettle是一款开源的ETL工具,允许管理来自不同数据库的数据,进行抽取、转换、装入和加载数据完成项目:
多表抽表、创建资料库主要内容:
-
kettle安装及配置
创建资料库
DB连接
不同表源表输入
-
表输出
Transform
脚本使用
简易抽取
-
多表抽表
插入更新
数据同步及合并记录
增量更新时间戳方案
-
行转列
多台电脑相互抽取
oracle远程抽取
job
课程内容
学习目标:
Informatica PowerCenter 是世界级的企业数据集成平台,它在ETL领域中无论是执行能力还是战略远见方面都是佼佼者,是Informatica公司的核心产品完成项目:
项目考勤系统、KPI绩效考核系统主要内容:
-
informatica服务器端
informatica客户端安装
informatica抽取数据源
informatica抽取目标
-
映射
创建任务及定义工作流
informatica表达式
informatica聚合
-
查询及排序
informatica行转列
informatica路由
informatica过滤器
-
informatica增量抽取
join同构及异构
考勤系统ETL开发
课程内容(选修)
学习目标:
掌握HDFS分布式文件系统、MapReduce分布式编程模型、MapReduce编程等。完成项目:
用户行为分析项目、精准广告投放项目主要内容:
-
大数据介绍
Hadoop起源和发展
Hadoop集群环境安装
HDFS设计思想
-
Shell使用
eclipse开发环境搭建
JavaAPI使用
HDFS底层原理
-
查询及排序
HDFS文件上传和下载
副本存放策略
MapReduce执行流程
-
序列化机制
多Job串联
自定义计数器
ReduceJoin
课程内容(选修)
学习目标:
大数据数据仓库:该课程实现在大数据场景下,使用hadoop平台中的hive数据仓库实现数据的存储、查询和分析完成项目:
猫眼电影影评分析主要内容:
-
Hive基本介绍
Hive数据架构
Hive基本使用
Hive服务
-
DDL详解
分区和分桶
Hive数据类型
自定义分隔符解析
-
微博案例
影评案例
拉钩案例
NBA案例
-
SQL执行过程解析
窗口分析函数
Shell操作
企业级数据仓库构建
课程内容
学习目标:
商务智能 (BI)包含的应用系统和技术较宽泛,通过收集、存储、分析和提供对数据的访问,来帮助企业用户做出更好的商务决策。完成项目:
汽车项目、医疗项目主要内容:
-
商业智能BI概述
工作流程介绍
数据可视化概述
tableau安装
-
数据源工作表
字段基本操作
tableau表计算
排序与筛选
-
参数分析线
tableau图表分析
tableau实战
tableau prep
-
Tableau数据提取
基本筛选器
课程内容
学习目标:
FineReport作为企业首选的web报表软件,可视化拖拽操作就能制作各类报表图表.被成功应用于4500+知名企业,12000+项目,覆盖223个行业细分领域完成项目:
中国电影发展分析、Lending Club借贷平台数据分析主要内容:
-
帆软入门
简单报表
单元格扩展和父子格
分组报表
-
自由报表
交叉报表
主子报表
简单多源报表
-
动态格间运算
图标交互属性
产品下载与功能点介绍
手机预览与自适应
-
模板布局设计
配色美化
微信集成
钉钉集成