--限時免費課程--
透過 12 個以上的實際操作範例,學習使用 Apache Spark 和 Scala 來做大數據分析
從這 7 個小時的課程,你會學到
1. Apache Spark 架構的概述。
2. 使用 Apache Spark 的主要抽象層,適應性分散式資料集(RDD)來處理和分析大型資料集。
3. 使用 RDD transformations 和 actions 以及 Spark SQL 開發Apache Spark 2.0 應用程式
4. 透過 Amazon 的 Elastic MapReduce 服務將 Spark 應用程式在一個 Hadoop YARN cluster 擴展
5. 使用資料集和 DataFrames 和發展對於 Spark SQL透徹的理解來分析結構化和半結構化資料
6. 通過廣播變數和累加器在 Apache Spark cluster 上分享位於不同節點上的資訊
7. 使用先進的技術和通過切割( partitioning ),緩存( caching ) ,persisting RDDs 來優化和調整 Apache Spark
8. 在領域中使用 Apache Spark 的最佳實踐
>英文字幕:有
https://softnshare.wordpress.com/…/apache-spark-with-scala…/
Search
spark rdd 在 What is RDD in Spark | Spark Tutorial | Intellipaat - YouTube 的必吃
Intellipaat Spark Training:- https://intellipaat.com/apache- spark - scala -training/#sparkrdd #whatisRDDinspark #sparktutorial #sparktraining ... ... <看更多>