网站用户行为分析

时间:2020-12-27 15:42:33   收藏:0   阅读:30
  1. 步骤

1.1 本地数据集上传到数据仓库Hive

  1. 数据集下载与查看
  2. 数据集预处理
  3. 把数据集导入HDFS中
  4. 在Hive上创建数据库

1.2 Hive数据分析

  1. 给出数据分析需求
  2. 用select语句实现数据分析
  3. 数据分析结果查看与保存

     

1.3 Hive、MySQL、HBase数据互导

 

  1. 操作过程

2.1 数据准备

数据集下载与查看

cd /usr/local

ls

sudo mkdir bigdatacase

sudo chown -R hadoop:hadoop ./bigdatacase

cd bigdatacase

mkdir dataset

cd ~/下载

ls

unzip user.zip -d /usr/local/bigdatacase/dataset

cd /usr/local/bigdatacase/dataset

ls

head -5 raw_user.csv

数据集预处理

sed -i 1d raw_user

head -5 raw_user.csv

技术分享图片

vim pre_deal.sh

 技术分享图片

 

 

bash ./pre_deal.sh raw_user.csv raw_user.txt

head -10 raw_user.txt

 技术分享图片

 

 

 

把数据集导入HDFS中

hdfs dfs -mkdir -p /bigdatacase/dataset

hdfs dfs -put /usr/local/bigdatacase/dataset/raw_user.txt /bigdatacase/dataset

hdfs dfs -ls /bigdatacase/dataset

hdfs dfs -cat /bigdatacase/dataset/raw_user.txt | head -10

技术分享图片

 

 

 

 

在Hive上创建数据库

 

hive

create database dblab;

use dblab;

CREATE EXTERNAL TABLE dblab.rawdata_user(id INT,uid STRING,item_id STRING,behavior_type INT,item_category STRING,visit_date DATE,province STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘
STORED AS TEXTFILE
LOCATION ‘/bigdatacase/dataset‘;

select * from rawdata_user limit 10;

技术分享图片

 

 

 

 

 

2.2 Hive数据分析

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

    分析步骤

(2)用户行为分析需求:分析每月1-31号购买情况

 技术分享图片

 

 

(3)自定义需求:

用户购买次数大于5的用户id和地区信息以及购买次数

 技术分享图片

 

 

  1. 小结

原文:https://www.cnblogs.com/ZHAIC005/p/14196909.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!