数据可视化学习笔记:Tableau技能提升的完整记录
| | | |
|---|
| 维度 | 观察数据的角度,包含名称、日期、地理数据等定性值;用于分类、分段、揭示详细信息 | | 时间维度(2020年)、地区维度(北京)、职业维度(数据分析师) |
| 度量 | 观察数据的统计值,包含可测量的数字定量值;支持聚合运算(求和、平均等) | | |
案例解析:以「2025年北京地区数据分析师平均薪资20k」为例- 维度:时间(2025年)、地区(北京)、职业(数据分析师)
| | | |
|---|
| 离散 | | | |
| 连续 | | | 温度(23.5℃)、身高(175.3cm)、薪资(20.5k) |
Tableau支持7种核心数据类型,通过专属图标进行识别: | | | |
|---|
| 文本/字符串 | | | |
| 日期格式 | | | |
| 日期时间格式 | | | |
| 数字格式 | | | |
| 布尔值 | | | |
| 地理值 | | | |
| 群集组 | | | |
- 数据源页面转换:点击字段名称旁的类型图标→选择目标类型
- 工作表数据窗格转换:字段下拉菜单/右键菜单→"更改类型"→选择对应类型
转换成功后系统自动生成经度、纬度字段,可制作地理分布地图:- 将地理字段拖至行/列功能区,Tableau自动生成基础地图
| | | |
|---|
| MySQL | | 服务器地址/端口(3306)/数据库名/用户名/密码 | |
| Hive | | | |
特殊机制:导入单个文件时自动读取整个文件夹内所有文本文件。- 输入标准SQL语句(如:
SELECT * FROM dwr LIMIT 5)
效果验证:自定义查询结果vs全表数据,验证数据筛选有效性。需求背景:在英雄榜中添加身份证、门派、角色、性别字段
- 定义:将多张结构完全一致的表通过行追加方式合并为单表
- 仅支持通配符合并:Excel导入时默认仅加载单个工作表
- 操作步骤:新建并集→选择"通配符"模式→设置搜索范围→合并所有Excel文件
| | |
|---|
| | 提取数据至Tableau引擎,本地Hyper格式保存 |
| | |
| | |
| | |
| | |
| | |
- 功能特点:数据变化可通过刷新实时同步(如Excel文件修改后刷新即可更新)
- 核心逻辑:不本地存储数据,避免敏感信息在终端设备留存
- 当原数据库处理速度无法满足分析需求时,利用Tableau引擎加速计算
- 适用于出差、异地演示或居家办公场景,支持无网络环境下的数据操作
- 对核心业务系统,通过本地提取降低直接访问频率,减少系统负载
- 通过右键刷新、「数据提取」按钮或「刷新所有数据提取」功能更新本地数据
核心作用:自动检测并修复文本文件导入时的字段识别错误- 导入文本文件后若字段被命名为"F1-F5"等默认名称
- 选中需转置的字段列(如苹果、华为、小米、三星四列)
- 恢复:勾选"显示隐藏字段" → 选中隐藏列 → "取消隐藏"
| | | | |
|---|
| | | | |
| Tableau Packaged Workbook | | | |
| | | |
|---|
| | | |
| Tableau Data Source Packaged | | |
- Hyper格式:Tableau数据提取的专用格式,通过本地化缓存实现性能提升和压力降低
- 文件输出:根据需求选择TWBX/TDSX/Hyper等格式保存
- 性能考量:数据连接/合并增加数据量,混合关系仅临时关联
数据加载技术选型本质实时连接与数据提取的选择:本质是实时性与性能/灵活性的权衡安全注意事项:实时连接需确保数据源访问权限控制;数据提取需注意本地文件加密- 对高频更新但非实时需求的数据(如日报表),可采用定时刷新的数据提取平衡性能与时效性
- 类型转换不可逆性:建议转换前备份原始字段,避免数据丢失
以上,通过Tableau学习笔记,记录成长与收获,目标成为能够独立完成复杂分析项目的实践者。