Update README.md
基于hadoop生态搭建的电商数据仓库,整体功能架构包含数据采集、数仓搭建、数据导出、数据可视化等。
图片加载失败请查看
电商数据仓库项目简介
详情学习攻略请查看
hadoop安装
hive安装
hive常用命令
完善中…
项目踩坑请查看
Linux卸载安装Mysql踩坑
Linux报错只读文件系统(集群非法关机、断电)踩坑
sqoop拒绝连接
kafka manager启动失败解决方案
hive拒绝连接解决方案
系统数据流程如下图:
数仓分层如下图:
hive表关系图如下图:
├─azkaban azkaban job文件 │ ├─flume-interceptor 采集flume拦截器,用来区分日志类型与简单数据清洗 │ ├─hive │ └─gmall │ ├─用户行为数仓 用户行为数仓hive sql │ │ │ └─系统业务数仓 系统业务数仓hive sql │ ├─hive-function hive自定义函数 │ ├─log-collector 生成日志文件项目,打包成jar包后通过命令运行,将标准输出重定向至log文件即可 │ ├─mysql mysql结构、函数 │ ├─shell 数仓中常用脚本 │ ├─ads ads层加载数据脚本 │ │ │ ├─dwd dwd层加载数据脚本 │ │ │ ├─dws dws层加载数据脚本 │ │ │ ├─ods ods层加载数据脚本 │ │ │ ├─sqoop mysql导入导出数据脚本 │ │ │ ├─tools 集群公共脚本 │ │ │ └─utils 通用工具脚本 │ └─spring-boot-echarts-master 可视化web项目
基于hadoop生态搭建的电商数据仓库,整体功能架构包含数据采集、数仓搭建、数据导出、数据可视化等
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
-mall-data-warehouse-
项目简介
基于hadoop生态搭建的电商数据仓库,整体功能架构包含数据采集、数仓搭建、数据导出、数据可视化等。
图片加载失败请查看
电商数据仓库项目简介
详情学习攻略请查看
hadoop安装
hive安装
hive常用命令
完善中…
项目踩坑请查看
Linux卸载安装Mysql踩坑
Linux报错只读文件系统(集群非法关机、断电)踩坑
sqoop拒绝连接
kafka manager启动失败解决方案
hive拒绝连接解决方案
系统架构
系统数据流程如下图:
数仓分层如下图:
hive表关系图如下图:
技术架构
项目结构说明
集群规划
脚本说明
hive 表说明
完善中…
mysql 表说明
完善中…