精準數源—Cloudera官方指定認證培訓機構 一直秉承著“科學、高效、權威、品質”的教學宗旨,以“追求卓越服務,與企業共同發展“的努力目標,為企事業單位培養更多更優秀的數據技術人才,加速企業以應對大數據挑戰。 【機構優勢】 ●Cloudera原廠講師 ●Cloudera原廠課程 ●全球最具權威的大數據資質認證 ●國際最新的課程體系 ●國內通過Cloudera管理員和數據分子式培訓并順利拿到講師資格證書最多的企業 【課程內容】 1、Hadoop生態圈、實驗場景介紹、用Hadoop工具導入數據 2、pig的特性、使用案例、和pig交互、pig Latin語法、Field定義、用pig執行ETL流程
3、pig處理復雜數據,復雜/nested嵌套的數據類型、用pig分析廣告戰役的數據
4、pig的多數據組操作,pig鏈接多數據組、用pig分析離散的數據組
5、用流處理和UDFs擴展pig,Macros和Imports、contributed functions,用其他語言和pig一起處理數據
6、pig故障排查和優化,用web界面排查一個故障的任務、Data采樣和故障排查、理解執行計劃、提高pig任務性能
7、hive表結構和數據儲存、對比hive和傳統數據庫、hive vs.pig、hive使用案例
8、hive的關系數據分析、數據管理、文本處理、優化及擴展,在shell、腳本和hue上運行hive查詢
9、impala和hive、pig、關系數據庫的不同、使用impala shell
10、采樣impala分析數據,過濾、排序and limiting results,提升impala性能,impala的交互式分析
11、對比map reduce、pig、hive、impala和關系數據庫 【課時】 4天 7課時/天 【學員基礎】 該課程適合有SQL經驗和基本Unix和Linux命令的數據分析師、業務分析師和管理員。 無需Java和Apache Hadoop經驗 【課程時間】 10月24日—27日(09:00—18:00)
|