课程描述INTRODUCTION
快速了解大数据玩法
日程安排SCHEDULE
课程大纲Syllabus
课时一:概念综述
1.大数据的定义由来和原因
1.大数据的6V特征
1.从数据库,数据仓库到大数据
1.大数据相关技术和处理
课时二:Hadoop生态圈、spark生态圈、搜索引擎概述
1.hadoop:HDFS、Map-Reduce、Hbase、Hive等
1.spark:scala、spark-SQL、spark-Streaming等
1.搜索引擎:lucene(solr)、ES
1.并发的机器学习工具:R-hadoop、spark-MLLIB、 spark-R、pyspark
课时三:存储在hbase中的数据
1.NoSQL(key-value)
1.Hbase:安装
1.行键与列簇
1.如何利用Hbase的特点存储数据
1.应用程序如何访问Hbase中的数据
1.数据迁移:sqoop
1.Hbase的应用场景
课时四:Hive:为用SQL的开发者留的活路
1.Hive:安装(单用户与多用户)
1.Hive:基本操作
1.Hive:与典型的关系型数据库的区别
1.如果“想慢”,你可以这样…(不恰当使用hive的案例介绍)
1.Hive的应用场景
课时五:Spark各组件在卫生领域的应用
1.Hadoop*的特点是什么?
1.Spark概述与安装
1.Scala:你可以一直“点”下去
1.RDD:“映射”、“转换”解决一切
1.spark-SQL
1.spark-streaming
1.spark的其他组件
1.应用场景
课时六:机器学习算法介绍—I
1.综述(人工智能、数据挖掘、机器学习、机器智能、大数据:这些词的确切含义)
1.监督学习、无监督学习与强化学习
1.工具:R、Python等
1.决策树详解(熵、贪心法、连续的和离散的)
1.神经网络详解(神经元、激励函数、前馈神经网络的BP算法,其他神经网络)
课时七:机器学习算法介绍—II
1.关联规则详解(频繁项集、Apriori、支持度、置信度)
1.聚类详解(k-means、k-medoid)
1.常见算法的简述(Na?ve-Bayes、k-NN、HMM、SVM等)
转载://www.ibid2.com/gkk_detail/65026.html
已开课时间Have start time

- 叶梓
人工智能内训
- 信用卡直播,结合人工智能 武建伟
- 《游戏规则改变--当制药业 王明哲
- 《数字化转型中的仿真》 王明哲
- 《乡村振兴金融新思维——A 武建伟
- 数智赋能—走在 AI 浪潮
- AI赋能企业增长的新纪元—
- 5G、物联网、数字化转型等 胡国庆
- 《AI领导力思维》 武建伟
- 数智赋能—走在 AI 浪潮
- “职场加速器”AI实用工具 单康华
- 《未来管理革新:ChatG 武建伟
- AI商用训练营——增加工作 武建伟


江南体育平台是真的吗
:
课程价格:
培训天数: