『字节青训营-4th-大数据』L19:用户数据分析理论与最佳实践
相关链接
🎶 学员手册:【大数据专场 学习资料七】第四届字节跳动青训营 - 掘金
P1:基础篇
为什么要做用户数据分析
数据分析的各个环节
数据分析全景图
指标体系和指标分级
手游业务指标体系示意
口径:你怎么算出来的
搭建指标体系的价值
数据分析的各个环节
埋点简介
常见的分析工具
- 维度:分组项(日期和操作系统),指标:设备去重数
- 聚和,最大最小…
- 可以,但一般会先划分
数据可视化
选择合适的
数据分析的流程和案例
分析流程
案例
获取
激活
思考各个环节,哪些是要重点改进的地方
留存
收入
可以得出结论,这个游戏就是靠头部用户来维持运营的,来指导产品经营
数据分析常见的问题
总结&思考
P2:进阶篇
机器学习概览
为什么要机器学习
什么是机器学习
例:垃圾邮件过滤程序
开发者自己从现有的样本提取特性信息,对于新的样本又要手动增加过滤规则
使用机器学习,自动总结、添加规律
机器学习算法有哪些
机器学习的挑战有哪些
特征工程
概述
流程
- 数据理解
- 结构化/非结构化
- 定量/定性
- 数据预处理
- 衡量数据质量
- 准确性
- 完整性
- 一致性
- 时效性
- 可信性
- 解释性
- 主要步骤
- 数据清洗
- 缺失值
- 异常值
- 噪声
- 数据集成
- 实体识别
- 冗余
- 数据值冲突
- 数据规约
- 维度规约
- 维度变换
- 数据交换
- 规范化
- 离散化
- 稀疏化
- 数据清洗
- 衡量数据质量
- 特征构造
- 聚合
- 转换
- 特征选择
- Filter 方法(过滤式)
- Wrapper方法(封装式)
- Embedded方法(嵌入式)
(这些在学习资料里有很详细的说明)
Embedding 概览
Embedding 产生过程
Embedding 意义作用
Embedding 应用场景
聚类算法
概览简介
指标波动
K-means
聚类画像分析
概览简介
流程
分析过程
左:北极星
应用场景
评论
GiscusTwikoo