在這個全面的課程中學習和掌握最受歡迎的大數據技術,由亞馬遜和 IMDb 的前工程師和高級經理教授。
從這 14.5 小時的課程,你會學到
1. 設計運用 Hadoop 和相關技術管理“大數據”的分散式系統。
2. 使用 HDFS 和 MapReduce 大規模儲存和分析資料。
3. 使用 Pig 和 Spark 創建腳本,以更複雜的方式處理 Hadoop 群集上的資料。
4. 使用 Hive 和 MySQL分析關聯資料
5. 使用 HBase、Cassandra 和 MongoDB 分析非關係資料
與 Drill、Phoenix 和 Presto 互動式查詢資料
6. 為你的應用選擇合適的資料儲存技術
7. 了解 Hadoop 群集如何由 YARN、Tez、Mesos、Zookeeper、Zeppelin、Hue 和 Oozie進行管理。
8. 使用 Kafka、Sqoop 和 Flume 將資料發佈到你的 Hadoop群集
9. 使用Spark Streaming、Flink 和 Storm 處理串流資料
https://softnshare.com/ultimate-hands-on-hadoop-tame-your-…/
spark hive 在 iThome Facebook 的最佳貼文
現在用戶只要在最新版的Amazon EMR中安裝Hive、Spark、Presto任何一個元件,就能使用Hudi簡單地修改單筆記錄資料。
spark hive 在 軟體開發學習資訊分享 Facebook 的最佳解答
-- 好工作分享 --
WhosCall 公司 Naver集團( Line )旗下Gogolook Co., Ltd 徵才 Data engineer
臺灣,香港,韓國,泰國,巴西跨國跨文化團隊
https://whoscall.com/zh-TW/careers/joblist/57
你的使命
1 使用機器學習或深度學習建立現代的 Whoscall 產品
2 為資料建模建立自動化流程
3 與計劃人員和程式設計團隊合作,為各種資料專案建構概念驗證系統
要求
1 熟悉 Python
2 有 Keras 的 TensorFlow,Scikit-learn 經驗
3 熟悉 Word 嵌入,網路嵌入相關知識(word2vec,deepwork 等)
4 熟悉機器學習和深度學習訓練(Dropout, bagging, sampling, CNN, RNN, regression, k-means 等)
5 有 AWS 或 GCP 相關的經驗
6 熟練使用 SQL、 Hive、 Presto 等查詢語言
7 資料導向型人格和良好的溝通技巧
8 深刻理解現代機器學習技術及其數學基礎,如分類、推薦系統和自然語言處理
9 具有分散式機器學習和計算框架的經驗(Spark、 Mahout 或其他類似) ,有應用經驗者優先
相關線上學習課程 :
✍AWS https://softnshare.com/tag/affiliate-aws/
✍GCP https://softnshare.com/?s=gcp
✍TensorFlow https://softnshare.com/tag/tensorflow/
✍Python https://softnshare.com/python-learning-maps/
✍SQL https://softnshare.com/?s=SQL
✍Machine Learning http://bit.ly/2PElikL
✍NLP http://bit.ly/SNS-NLP
✍Spark https://softnshare.com/tag/spark/
✍Math. https://softnshare.com/tag/math/
https://whoscall.com/zh-TW/careers/joblist/57/