相关链接

P1:基础篇

image-20220829103741375

image-20220829103810032

为什么要做用户数据分析

image-20220829103934090

数据分析的各个环节

数据分析全景图

image-20220829104040870

指标体系和指标分级

手游业务指标体系示意

image-20220829151726070

口径:你怎么算出来的

搭建指标体系的价值

image-20220829152158554

数据分析的各个环节

埋点简介

image-20220829152220803

image-20220829152508546

常见的分析工具

image-20220829152729090

image-20220829152750929

image-20220829153001233

image-20220829153048387

  1. 维度:分组项(日期和操作系统),指标:设备去重数
  2. 聚和,最大最小…
  3. 可以,但一般会先划分

image-20220829153316529

数据可视化

image-20220829153411788

image-20220829153417185

选择合适的

image-20220829153437073

image-20220829153449228

image-20220829153454664

数据分析的流程和案例

分析流程

image-20220829153642854

image-20220829153753252

案例

获取

image-20220829153832099

image-20220829153854398

激活

image-20220829153925884

思考各个环节,哪些是要重点改进的地方

留存

image-20220829154028749

收入

image-20220829154042704

可以得出结论,这个游戏就是靠头部用户来维持运营的,来指导产品经营

数据分析常见的问题

image-20220829154304641

总结&思考

image-20220829154446510

image-20220829154453890

P2:进阶篇

image-20220829154902165

机器学习概览

为什么要机器学习

image-20220829154939288

什么是机器学习

image-20220829155007322

例:垃圾邮件过滤程序

开发者自己从现有的样本提取特性信息,对于新的样本又要手动增加过滤规则

使用机器学习,自动总结、添加规律

机器学习算法有哪些

image-20220829155449552

机器学习的挑战有哪些

image-20220829155537350

特征工程

概述

image-20220829155639741

流程

image-20220829155843838

image-20220829155853108

  • 数据理解
    • 结构化/非结构化
    • 定量/定性
  • 数据预处理
    • 衡量数据质量
      • 准确性
      • 完整性
      • 一致性
      • 时效性
      • 可信性
      • 解释性
    • 主要步骤
      • 数据清洗
        • 缺失值
        • 异常值
        • 噪声
      • 数据集成
        • 实体识别
        • 冗余
        • 数据值冲突
      • 数据规约
        • 维度规约
        • 维度变换
      • 数据交换
        • 规范化
        • 离散化
        • 稀疏化
  • 特征构造
    • 聚合
    • 转换
  • 特征选择
    • Filter 方法(过滤式)
    • Wrapper方法(封装式)
    • Embedded方法(嵌入式)

(这些在学习资料里有很详细的说明)

Embedding 概览

image-20220829161046367

Embedding 产生过程

image-20220829161127845

image-20220829161137649

Embedding 意义作用

image-20220829161201751

Embedding 应用场景

image-20220829161216918

聚类算法

概览简介

image-20220829161237097

image-20220829161322133

image-20220829161329693

指标波动

image-20220829161407335

K-means

image-20220829161448947

聚类画像分析

概览简介

image-20220829161846348

流程

image-20220829161912283

分析过程

image-20220829162226297

image-20220829162334888

image-20220829162403958

image-20220829162611433

image-20220829162655198

image-20220829162717468

左:北极星

image-20220829162801119

image-20220829162842047

应用场景

image-20220829162852764