Hadoop

时间:2019-10-22 11:23:42   收藏:0   阅读:100
Hadoop:
大数据集群,只能运行在Linux平台
RDBMS:表
字段、数据类型、约束
结构化数据
关系数据库在数据中占据重要的地位
但不是所有的数据都可以结构化
结构化数据:structured data
非结构化数据:unstructured data
半结构化数据:semi-structured data
通常保存为xml , json
Google:pagerank 页面算法
化整为零,并行处理
将一个大问题切割成多个小问题
OLAP:数据挖掘
机器学习:deep learning
多节点并行处理

Map reduce:
函数式编程API
运行框架

原文:https://blog.51cto.com/14087650/2444340

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!