查看: 84|回复: 0
打印 上一主题 下一主题

SparkSQL极速入门 整合Kudu实现广告业务数据分析

[复制链接]

9万

主题

9万

帖子

28万

积分

管理员

管理员

Rank: 9Rank: 9Rank: 9

积分
289332
跳转到指定楼层
楼主
发表于 2022-5-18 00:18:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
游客,如果您要查看本帖隐藏内容请回复

                               
   
        
            
                五大知识板块 掌握大数据处理技术Spark SQL
                每个大数据工程师都不应错过的必备大数据开发技能
               
                    
                        Spark SQL快速入门
                        
                            SQL on Hadoop
                            Spark SQL概述、架构、常见误区
                            spark-shell/spark-sql启动流程分析
                        
                    
                    
                        Spark SQL API编程
                        
                            SparkSession & SQLContext
                            DataSet & DataFrame API
                            DataFrame & DataSet
                            与RDD的互操作
                        
                    
                    
                        Data Source API
                        
                            Data Source API处理text/JSON/
                            Parquet/JDBC数据
                            SaveMode的正确选择
                            配置参数统一管理
                        
                    
                    
                        整合Hive操作及函数
                        
                            Spark整合Hive的数据操作
                            ThriftServer的使用
                            Spark SQL内置函数&自定义函数实战
                        
                    
                    
                        Kudu
                        
                            Kudu概述、核心概念、架构及部署
                            Kudu API操作
                            Spark Data Source API
                            读写Kudu数据
                        
                    
               
            
        
   
   
        
            
                广告业务项目实战 从构建到优化一“战”搞定
                经典广告业务项目 高匹配度的功能与问题 带你更好的理解SparkSQL
               
               
               
                    项目做完回头看 学学大牛如何调优与思考
                    学习技术受用一时 领悟思想受用一生
                    
                        
                           
                            Spark调优策略
                           
                                合理设置资源
                                广播变量带来的好处
                                Shuffle调优
                                Spark与GC相关概念理解
                                JVM GC引起的相关问题调优
                           
                        
                        
                           
                            Presto
                           
                                Presto概述、架构
                                Presto部署
                                Presto API操作
                                综合案例实战
                           
                        
                        
                           
                            关于大数据云平台建设
                           
                                大数据云平台建设涉及哪些功能
                                产品化设计思路
                                元数据在大数据平台中的设计思路
                                Spark VS Flink
                           
                        
                    
               
            
        
   
   
        
            
                这是一门Spark SQL课程 也是一门Spark工程师进阶课程
               
                    
                        夯实基础与应用 熟练掌握SparkSQL
                        对Spark SQL重新认识
                        对Spark的使用
                        Spark SQL对接TEXT、JSON等内置Data Source API的使用
                        spark-shell/spark-sql/spark-submit的基本使用
                        Spark SQL API编程的基本API使用
                        项目需求的功能实现
                        基于本地的开发和测试
                        基于Spark SQL进行大数据离线处理
                        基本的统计分析
                    
                    
                        基础之上再进阶 冲击Spark中高级工程师
                        Spark SQL对接TEXT、JSON等内置Data SourceAPI的使用
                        结合Kudu达到更好更快的性能 / Presto框架的使用
                        对接Kudu的Data Source API使用
                        详细拆解开脚本讲解的启动流程
                        基于业务需求定制开发自己的UDF函数
                        
                            通过“死去活来法” 进行参数的灵活配置及读取
                            讲解基于已实现功能如何逐步优化使得性能更佳
                            项目多轮重构,使得项目架构层级更清晰
                        
                        通过设计 ,以传递最少参数在服务器上运行
                        讲解构建大数据云平台中涉及到的方方面面
                        面向复杂的统计分析时,进行复杂业务功能的拆解思路
                    
               
            
        
   
   
        
            
               
                    学员专享增值服务
                    
                        
                           
                                
                                    
                                
                           
                           
                                学习社群
                                
                                    课程专属学习交流群,与优秀的人共同进步:互相
帮助,共同分享。
                                
                           
                        
                        
                           
                                
                                    
                                
                           
                           
                                课程源代码
                                免费提供课程源码,课程源码保持长期更新维护。
                           
                        
                    
                    
                        
                           
                                
                                    
                                
                           
                           
                                专题讨论
                                
                                    不定期组织技术话题讨论与群直播,疑难问题/热点
技术/职业规划/高效学习等热点观点等你参与。
                                
                           
                        
                        
                           
                                
                                    
                                
                           
                           
                                问答社区
                                遇到困难随时提问,讲师亲自答疑解惑
                           
                        
                    
               
               
                    
                        适合人群
                        
                            具备相关技术储备,想快速提升Spark技能以及想转行投身
                            大数据行业的小伙伴
                        
                    
                    
                        技术储备要求
                        
                            熟悉linux常用操作 / 熟悉SQL基本使用
                            了解Hadoop基础知识 / 了解Scala基本语法
                        
                    
               
            
        
   
                               
游客,如果您要查看本帖隐藏内容请回复
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|IT视频教程资源网 sitemap

GMT+8, 2024-10-17 17:20 , Processed in 0.388105 second(s), 22 queries .

快速回复 返回顶部 返回列表

客服
热线

微信
7*24小时微信 客服服务

扫码添
加微信

添加客服微信 获取更多

关注
公众号

关注微信公众号