🔥 รวบรวมข้อมูลจากแหล่งต่าง ๆ มาได้แล้ว...แต่รู้สึกว่ามันยังมั่วไปหมดเลย จะเอาไปวิเคราะห์ต่อต้องยากแน่ ๆ ต้องทำยังไงดี ??
.
👉 ปัญหาเหล่านั้นจะหมดไป ถ้าเพื่อน ๆ รู้จักกับการทำ “Data Cleansing” 🧹 และวันนี้แอดจะพาเพื่อน ๆ มาทัวร์เทคนิคต่าง ๆ ในการทำ Data Cleansing ให้ได้ข้อมูลแบบคลีน ๆ เพื่อเตรียมข้อมูลให้พร้อมใช้งาน ไม่ว่าจะนำข้อมูลไปวิเคราะห์ หรือทำงานใหญ่ ๆ อย่าง Machine Learning ได้อย่างมีประสิทธิภาพมากขึ้นนั่นเอง
.
มีเทคนิคอะไรบ้าง ? ไปติดตามกันโลดดด !
.
🌈 ก่อนอื่นเรามารู้จักนิยามของ Data Cleansing กันก่อน...ชื่อมันก็บอกอยู่แล้วว่า “ทำความสะอาด” ซึ่งมันเป็นกระบวนการทำความสะอาดข้อมูล ไม่ว่าจะเป็นการแก้ไข ลบ และจัดรูปแบบของข้อมูล ก่อนการนำข้อมูลไปวิเคราะห์ เพราะการรวบรวมข้อมูลจากแหล่งต่าง ๆ นั้น อาจจะมีรูปแบบของข้อมูลที่แตกต่างกัน หรืออาจมีข้อมูลซ้ำซ้อนกันได้ จึงต้องมีกระบวนการนี้เกิดขึ้นมานั่นเอง
.
และเทคนิคการทำ Data Cleansing มีดังนี้
.
🔸 Step1 : ลบข้อมูลที่ซ้ำกัน
.
การรวบรวมข้อมูลจากแหล่งต่าง ๆ อาจมีบางครั้งที่เกิดข้อผิดพลาด ซึ่งทำให้ข้อมูลที่เราได้มามีโอกาสซ้ำซ้อนได้ หากเรานำข้อมูลที่ยังซ้ำกันอยู่ไปวิเคราะห์ต่อ อาจจะทำให้ผลลัพธ์ที่ได้มาคลาดเคลื่อนไปจากค่าที่ควรจะเป็นได้ เราจึงต้องลบข้อมูลที่ซ้ำกันออกไป ซึ่งเดี๋ยวนี้เขาก็มีเครื่องมือเจ๋ง ๆ มากมายที่ช่วยจัดการข้อมูลที่ซ้ำกัน ไม่ว่าจะเป็น Excel, Google Sheet, หรือถ้าเทพหน่อยอยากจะเขียน Script ลบข้อมูลเองได้เลย !
.
🔸 Step2 : แก้ไขโครงสร้างข้อมูล
.
มันแน่นอนอยู่แล้วที่เวลาเรานำข้อมูลจากแหล่งต่าง ๆ มารวมกัน ข้อมูลเหล่านั้นอาจจะมีโครงสร้างที่ต่างกัน ตัวอย่างเช่น การตั้งชื่อ การใช้ตัวอักษรพิมพ์ใหญ่-พิมพ์เล็กที่ไม่สอดคล้องกัน หรืออาจจะเป็น Format ที่แตกต่างกัน เมื่อเรานำข้อมูลเหล่านั้นไปติด Label จัดหมวดหมู่หรือนำไปวิเคราะห์ต่อ อาจจะทำให้ข้อมูลเหล่านั้นตกหล่น หรือไม่ถูกนำไปจัดอยู่ในหมวดหมู่ที่ถูกต้องได้ เราจึงต้องแก้ไขโครงสร้างของข้อมูลให้อยู่ในรูปแบบเดียวกันทั้งหมดก่อนนั่นเอง
.
🔸 Step3 : กรองข้อมูลที่ผิดปกติ
.
ข้อมูลที่ถูกรวบรวมมาอาจจะมีบางส่วนที่ผิด เช่น พิมพ์ผิด ใช้หน่วยทางคณิตศาสตร์ผิดประเภทตัวเลขผิด และรวมไปถึงการป้อนข้อมูลที่ไม่เหมาะสม ซึ่งการกรองข้อมูลเหล่านี้ก่อนการวิเคราะห์จะทำให้ได้ข้อมูลมีประสิทธิภาพมากขึ้น
.
🔸 Step4 : จัดการข้อมูลที่ขาดหาย
.
อีกหนึ่งขั้นตอนสำคัญในการทำ Data Cleansing เราควรตรวจสอบข้อมูลที่ขาดหายหรือไม่สมบูรณ์ก่อนนำข้อมูลไปวิเคราะห์ อย่างเช่น ข้อมูลที่มีการพิมพ์ตกหล่น ไม่มีหน่วย หรือไม่มีวันที่ เพราะจะทำให้ผลลัพธ์จากการวิเคราะห์ข้อมูลนั้นคลาดเคลื่อนได้
.
🔸 Step5 : ตรวจสอบความถูกต้อง
.
เมื่อเราจัดการกับข้อมูลใน 4 ขั้นตอนด้านบนมาเรียบร้อยแล้ว เราก็ต้องมาตรวจสอบความถูกต้องอีกหนึ่งรอบเพื่อให้ได้ข้อมูลที่ครบถ้วนสมบูรณ์ และตรงตามเป้าหมายมากที่สุด เพื่อการนำข้อมูลไปวิเคราะห์ต่อได้อย่างมีประสิทธิภาพนั่นเอง !!
.
จะบอกว่าการทำ Data Cleansing เนี่ยเป็นขั้นตอนที่สำคัญมาก ๆ อาจจะต้องใช้เวลาถึง 80% ในกระบวนการวิเคราะห์ข้อมูลด้วยซ้ำ ลองคิดง่าย ๆ ถ้าเราอยากจะเทรนโมเดลสักอย่างนึง แต่ไม่มีข้อมูลดี ๆ คลีน ๆ มาใช้เทรน แล้วโมเดลที่ออกมามันจะไปแม่นยำได้อย่างไร…
.
ใครที่อยากจะทำโปรเจกต์ หรืองานทางด้านนี้อย่ามองข้ามขั้นตอนสำคัญพวกนี้เด็ดขาดเลย !!
.
และทั้งหมดนี้ก็เป็นขั้นตอนการทำ Data Cleansing หากเพื่อน ๆ ชอบเนื้อหานี้ อย่าลืมกดไลก์ กดแชร์เพื่อเป็นกำลังใจให้พวกเราผลิตคอนเทนต์ดี ๆ ต่อไปด้วยน้าาาา ❤️
.
borntoDev - 🦖 สร้างการเรียนรู้ที่ดีสำหรับสายไอทีในทุกวัน
同時也有2部Youtube影片,追蹤數超過12萬的網紅prasertcbs,也在其Youtube影片中提到,การอ่านข้อมูลที่อยู่ในรูปตาราง html ด้วย read_html จากหน้า web เช่น ข้อมูลตึกที่สูงที่สุดในโลกจาก Wikipedia รู้จักกับ regular expression เบื้องต้น การ...
data cleansing 在 BorntoDev Facebook 的精選貼文
🔥 SQL คืออะไร ?
.
🚀 SQL หรือ Structured Query Language เป็นภาษามาตรฐานคอมพิวเตอร์ที่ใช้ในการทำงานกับฐานข้อมูลตั้งแต่การจัดการข้อมูล (insert, delete, update, etc.) ไปจนถึงการดึงข้อมูล (query) ออกมาใช้งาน
.
เราสามารถนำความรู้ในภาษานี้ไปประยุกต์ใช้งานตั้งแต่เรียกค้น, เพิ่ม, ลบ, แก้ไข รวมถึงการจัดการฐานข้อมูลให้เป็นไปด้วยความราบรื่น
.
⚡ นอกจากนี้เรายังสามารถใช้ภาษา SQL กับการทำงานข้อมูลที่ซับซ้อนมาก ๆ ได้ เช่น ทำความสะอาดข้อมูล (data cleansing), แปลงข้อมูล (data transformation)
.
ไปจนถึงการคำนวณที่ซับซ้อนอย่าง Moving Average ก็สามารถทำได้เช่นกันอีกด้วย
.
“การเขียนภาษา SQL เป็นพื้นฐานที่ดีที่สุดในการเริ่มต้นทำงานกับข้อมูล และเป็นอีกหนึ่งในทักษะที่ทุกคนควรจะมีในยุคนี้”
.
✅ โดยในคอร์สเรียน Essential SQL for Everyone จาก BorntoDev ที่ให้เพื่อน ๆ สามารถเข้าไปเรียนกันได้แบบฟรี ๆ ไม่เสียค่าใช้จ่าย
.
เราได้จัดเตรียมเนื้อหาให้แบบเน้น ๆ ปูพื้นฐานให้ตั้งแต่เริ่มต้น ให้คุณได้เข้าใจตั้งแต่กระบวนการคิด จนถึงการปฏิบัติได้ด้วยตัวเอง
.
👉 ไม่ว่าคุณจะเป็นใคร ขอแค่เคยใช้งานคอมพิวเตอร์เบื้องต้นมาก็สามารถเรียนได้แล้ว ! ทำแบบฝึกหัดครบจบ รับใบ Certificate เลยทันที
.
รายละเอียด พร้อมลงทะเบียนตามแอดมาได้ที่นี่เลยนะคร้าบบ
.
⭐ https://www.borntodev.com/sql-for-everyone/
.
อย่ารอช้าา เด็ดกว่านี้หาได้ที่ไหน ? ชวนเพื่อน ๆ มาเรียนด้วยกันเยอะ ๆ นะคร้าบบ ❤️
.
#borntoDev - 🦖 สร้างการเรียนรู้ที่ดีสำหรับสายไอทีในทุกวัน
data cleansing 在 โปรแกรมเมอร์ไทย Thai programmer Facebook 的最佳貼文
วันนี้จะขอรีวิวหนังสือ วิทยาการคำนวณชั้นม. ปลาย
วิชาที่ดึงความรู้ป.ตรีสายไอที
มาปูพื้นฐานให้เด็กๆ ทั่วประเทศได้เรียนกัน
.
ซึ่งวิทยาการคำนวณชั้นม.4-5-6 เรียนอะไร? ....โพสต์นี้มีคำตอบ
👉 ม.4 -> ปูพื้นฐานวิทย์คอม ได้แก่ เรียนแนวคิดเชิงคำนวณ, อัลกอริทึม, การทำโครงงาน
👉 ม.5 -> เรียน data science (วิทยาการข้อมูล หรือวิทยาศาสตร์ข้อมูล)
👉 ม.6 -> จะแนวรวมยำเทคโนโลยีให้น้องๆ รู้จัก ตั้งแต่สอนเป็นบล็อกเกอร์ รู้จัก AI, คลาวด์, IoT, AR, การเป็นพลเมืองดิจิตัล , กฏหมายดิจิตัล, การประกอบอาชีพไอที และอื่นๆ (ไม่ยากนะ)
.
===========
รีวิว ม.4
===========
วิทยาการคำนวณ ม.4 มีจำนวน 3 บท
🔥 +++บทที่ 1 แนวคิดเชิงคำนวณ +++++
บทนี้จะสอนแนวคิดเชิงคำนวณ (Computational Thinking) คืออะไร?
ซึ่งใครไม่รู้จักอาจงงเล็กน้อย ถึงปานกลาง
หรือเกิดคำถามคาใจ เรียนไปใช้ทำอะไรครับคุณครู
.
สำหรับแนวคิดเรื่อง Computational Thinking
(เรียกเป็นภาษาอังกฤษดีกว่า)
มีไว้เพื่อใช้แก้ปัญหาในแวดวง “วิทยาศาสตร์คอมพิวเตอร์” 🤩 🤩
จริงๆ แล้วมันไม่ใช่เรื่องแปลกใหม่แต่อย่างใด
.
ถ้าเราได้นั่งเรียนในระดับมหาวิทยาลัย
หรือได้ฝึกเขียนโปรแกรมไปเรื่อยๆ ก็จะใช้แนวคิดนี้โดยธรรมชาติ
อย่างไม่รู้ตัวอยู่แล้วครับ ไม่ต้องไปเรียนที่ไหน
.
นิยามของ Computational Thinking หรือแนวคิดเชิงคำนวณ
จะประกอบด้วยแนวคิดย่อย 4 อย่างดังนี้
1) Algorithm
2) Decomposition
3) Pattern recognition
4) Abstract thinking
.
หลายละเอียดแต่ละหัวข้อก็ตามนี้
👉 1) Algorithm ชื่อไทย “ขั้นตอนวิธี”
Algorithm คือลำดับขั้นตอนในการแก้ปัญหาหรือการทำงานที่ชัดเจน การคิดค้น อธิบายขั้นตอนวิธีในการแก้ปัญหาต่าง ๆ
.
ถ้าเคยเรียนตอนป.ตรี คงรู้จักคำนี้ดีไม่ต้องอธิบายมาก เช่น
-จะคำนวณหาพื้นที่เส้นรอบวง ต้องมีสเตปคำนวณอย่างไรบ้าง
-จะค้นหาข้อมูลแบบ binary search ต้องมีขั้นตอน 1,2,3 อย่างไรบ้าง
-จะหาเส้นทางที่ใกล้สุดในกราฟ ด้วยวิธี Dijkstra จะมีขั้นตอน 1,2,3 อย่างไรบ้าง
.
👉 2) Decomposition ชื่อไทยคือ “การแยกส่วนประกอบ และการย่อยปัญหา”
.
Decomposition เป็นการพิจารณาเพื่อแบ่งปัญหา หรืองานออกเป็นส่วนย่อย ทำให้สามารถจัดการกับปัญหาหรืองานได้ง่ายขึ้น พูดง่ายๆ เอาปัญหามาแยกย่อยออกเป็นส่วนๆ
.
⌨ ตัวอย่างการนำไปใช้ตอนเขียนโปรแกรม
เช่น การเขียนโปรแกรมแยกเป็นส่วนๆ แยกเป็นแพ็กเกจ แยกเป็นโมดูล
หรือทำระบบเป็น services ย่อยๆ หรือมองเป็น layer เป็นต้น
.
👉 3) Pattern recognition ชื่อไทยคือ “การหารูปแบบ”
.
Pattern recognition เป็นทักษะการหาความสัมพันธ์ที่เกี่ยวข้อง แนวโน้ม และลักษณะทั่วไปของสิ่งต่าง ๆ
.
⌨ ตัวอย่างการนำไปใช้ตอนเขียนโปรแกรม
เมื่อมีการทำงานของโปรแกรมที่หลากหลายแบบ
แต่ทว่ามีรูปแบบที่แน่นอนซ้ำๆ กัน
เราสามารถยุบโค้ดมาอยู่ในฟังก์ชั่นเดียวกันได้หรือไม่
หรือเขียนเป็นโปรแกรมวนลูป ให้อยู่ในลูปเดียวกัน เป็นต้น
.
👉 4) Abstract thinking ชือไทย “การคิดเชิงนามธรรม”
.
Abstract thinking เป็นกระบวนการคัดแยกคุณลักษณะที่สำคัญออกจากรายละเอียดปลีกย่อย ในปัญหา หรืองานที่กำลังพิจารณา เพื่อให้ได้ข้อมูลที่จำเป็นและเพียงพอในการแก้ปัญหา
⌨ ตัวอย่างการนำไปใช้ตอนเขียนโปรแกรม
-ก็เช่นการใช้ฟังก์ชั่น โดยเราแค่รู้รายละเอียดว่าฟังก์ชั่นทำงานอะไร ต้องการ input/ouput อะไร แล้วได้ return อะไรกลับมา ส่วนเนื้อหาไส้ในละเอียดเรามองไม่เห็น
.
🔥 +++++ บทที่ 2 การแก้ปัญหาและขั้นตอนวิธี +++++++
บททนี้เขาจะปูพื้นฐานอัลกอริทึมให้กับเด็กครับ ได้แก่
2.1 การแก้ปัญหาด้วยคอมพิวเตอร์
2.2 สอนให้รู้จักระบุข้อมูล input, ouput และเงื่อนไขของปัญหา
2.3 สอนการนำแนวคิด Computational Thinking มาออกแบบอัลกอริทึม
มี flow chart โผล่มาเล็กน้อย
2.4 สอนเรื่องการทำซ้ำ หรือก็คือสอนให้รู้จักวนลูปนั่นเอง
2.5 สอนอัลกอริทึมได้แก่ การจัดเรียงและค้นหาข้อมูล
ภาษาอังกฤษก็คือ อัลกอริทึมสำหรับ sort & search
.
🤓 สำหรับเรื่อง sort ก็จะมี
- selection sort (ชื่อไทย การจัดเรียงแบบเลือก)
- insertion sort (ชื่อไทย การจัดเรียงแบบแทรก)
.
🤓 สำหรับเรื่อง search ก็จะมี
-sequential search (ชื่อไทย การค้นหาแบบลำดับ)
-binary search (ชื่อไทย การค้นหาแบบทวีภาค)
.
ลืมบอกไป Big-O ตอนเรียนป.ตรี ก็โผล่ออกมาแว็บๆ นิดหน่อย
เด็กอาจสงสัยมันคืออะไร เป็นญาติอะไรกับ Big-C เปล่าเนี่ย
.
🔥 ++++ บทที่ 3 การพัฒนาโครงงาน ++++
บทนี้ถ้าสรุปสั้นๆ ก็สอนให้เด็กเขียนเสนอโครงงาน
หรือก็คือเขียน proposal เหมือนตอนเรียน ป. ตรีแหละครับ
.
ถ้าใครจำไม่ได้ ก็จะประมาณว่า การเขียนโครงงานต้องมี
บทที่ 1 บทนำ
บทที่ 2 หลักการ ทฤษฏี และงานที่เกียวข้อง
บทที่ 3 วิธีการดำเนินงาน
บทที่ 4 การทดลองและผลการทดลอง
บทที่ 5 สรุปผล วิเคราะห์ และข้อเสนอแนะ
.
===========
รีวิว ม.5
===========
ในวิชา "วิทยาการคำนวณ" ระดับชั้น ม. 5
ได้ดึงวิชา data science (วิทยาศาสตร์ข้อมูล)
มาปูพื้นฐานให้เด็กๆ ได้เรียนกันแล้ว นับว่าเป็นโชคดี
เพราะวิชาพวกนี้เป็นของสูง กว่าจะสัมผัสก็คงตอนป.ตรี โท เอก
ซึ่งผมจะรีวิวเนื้อหาให้อ่านคร่าวๆ เนื้อหาแบ่งเป็น 4 บท
.
👉 ++++ บทที่ 1 - ข้อมูลมีคุณค่า +++++
.
Data science ในตำราเรียนใช้ชื่อไทยว่า "วิทยาการข้อมูล"
บทนี้จะกล่าวถึง Big Data หรือข้อมูลขนาดใหญ่ที่มีค่ามากมาย
และมีบทบาทมากในยุค 4.0 นี้ ทั้งภาครัฐและเอกชน
.
ถ้านึกไม่ออกก็นึกถึงเวลาเราเล่นเนตค้นหาใน Google จะพบข้อมูลมากมายมหาศาล ซึ่งเราสามารถนำมาใช้ในธุรกิจเราได้ ก็เพราะเหตุนี้ศาสตร์ด้านข้อมูล จึงมีบทบาทสำคัญอย่างมากอย่างยิ่งยวด
.
จึงไม่น่าแปลกใจที่ทำให้อาชีพนักวิทยาศาสตร์ด้านข้อมูล (ชื่ออังกฤษ data scientist) มันมีบทบาทสำคัญ และเป็นอาชีพที่มีเสน่ห์และน่าสนใจที่สุดยุคศตวรรษที่ 21
.
Data science ถ้าตามหนังสือเขาให้นิยามว่า
"เป็นการศึกษาถึงกระบวนการ วิธีการ หรือเทคนิค ในการนำข้อมูลจำนวนมหาศาล มาประมวลผล เพื่อให้ได้องค์ความรู้ เข้าใจปรากฏการณ์หรือตีความ ทำนายหรือพยากรณ์ ค้นหารูปแบบหรือแนวโน้มจากข้อมูล
และสามารถนำมาวิเคราะห์ต่อยอดเพื่อแนะนำทางเลือกที่เหมาะสม หรือใช้ในการตัดสินใจเพื่อประโยชน์สูงสุด"
.
สำหรับงาน Data science เขาจะมีกระบวนตามขั้นตอนดังนี้
- ตั้งคำถามที่ตนเองสนใจ
- เก็บรวบรวมข้อมูล
- การสำรวจข้อมูล
- การวิเคราะห์ข้อมูล (analyze the data)
- การสื่อสารและการทำผลลัพธ์ให้เห็นเป็นภาพ (communicate and visualize the results)
.
🤔 นอกจากนี้เขายังพูดถึง design thinking ...ว่าแต่มันคืออะไร?
ต้องบอกว่างานของนักวิทยาศาสตร์ข้อมูล
มันไม่ได้จบแค่เอาข้อมูลที่เราวิเคราะห์ได้แล้ว
มาโชว์ให้คนอื่นเข้าใจ
.
ยังต้องมีขั้นตอนการออกแบบแอพลิชั่น
ที่ต้องใช้ข้อมูลจากที่เราวิเคราะห์ไปนั่นเอง
ซึ่งคำว่า design thinking มันก็คือความคิดยิ่งนักออกแบบดีๆ นี้เอง
ซึ่งนักวิทยาศาสตร์ข้อมูลควรมีไว้เพื่อออกแบบแอพลิชั่นขั้นสุดท้าย
จะได้ตอบสนองความต้องการผู้ใช้
.
👉 ++++ บทที่ 2 การเก็บรวบรวมและสำรวจข้อมูล +++++
.
บทนี้ก็แค่จะปูพื้นฐาน
2.1 การเก็บรวบรวมข้อมูล
ในบทนี้จะพูดถึงข้อมูลที่เป็นลักษณะทุติยภูมิ
ที่หาได้เกลื่อนเน็ต และเราต้องการรวบรวมมาใช้งาน
2.2 การเตรียมข้อมูล (data preparation)
เนื้อหาก็จะมี
-การทำความสะอาดข้อมูล (data cleansing)
-การแปลงข้อมูล (data transformation)
ในม.5 ไม่มีอะไรมาก แต่ถ้าในระดับมหาลัยจะเจอเทคนิคขั้นสูง เช่น PCA
-การเชื่อมโยงข้อมูล (combining data)
2.3 การสำรวจข้อมูล (data exploration)
พูดถึงการใช้กราฟมาสำรวจข้อมูล เช่น
กราฟเส้น ฮิสโทแกรม แผนภาพกล่อง (box plot) แผนภาพแบบกระจาย (scatter plot)
พร้อมยกตัวอย่างการเขียนโปรแกรมดึงข้อมูลออกมาพล็อตเป็นกราฟจากไฟล์ csv (หรือ xls)
2.4 ข้อมูลส่วนบุคคล
สำหรับหัวข้อนี้ ถ้านักวิทยาศาสตร์ข้อมูลจะนำข้อมูลส่วนบุคคลมาใช้งาน ต้องเก็บเป็นความลับ ห้ามหลุด
.
ซึ่งประเด็นข้อมูลส่วนบุคคล ปัจจุบันมีก็มีร่างพรบ. คุ้มครองข้อมูลส่วนบุคคล ออกมาเรียบร้อยแล้ว
.
.
👉 ++++ บทที่ 3 การวิเคราะห์ข้อมูล ++++
.
แบ่งเป็น 2 ส่วน ได้แก่
.
3.1 การวิเคราะห์เชิงพรรณา (descriptive analytics)
เป็นการวิเคราะห์โดยใช้เลขที่เราร่ำเรียนมาตั้งแต่
- การหาสัดส่วนหรือร้อยละ
- การวัดค่ากลางของข้อมูล พวกค่าเฉลี่ย มัธยฐาน ฐานนิยม
- การหาความสัมพันธ์ของชุดข้อมูล (Correlation) พร้อมตัวอย่างการเขียนโปรแกรมให้ดูง่าย
.
.
3.2 การวิเคราะห์เชิงทำนาย (predictive analytics)
.
- มีการพูดถึงการทำนายเชิงตัวเลข (numeric prediction)
- พูดถึงเทคนิคอย่าง linear regression สมการเส้นตรงที่จะเอาไว้ทำนายข้อมูลในอนาคต
รวมทั้งพูดถึงเรื่อง sum of squared errors
ดูว่ากราฟเส้นตรงมันนาบฟิตไปกับข้อมูลหรือยัง (พร้อมตัวอย่างเขียนโปรแกรม)
- สุดท้ายได้กล่าวถึง K-NN (K-Nearest Neighbors: K-NN) เป็นวิธีค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว สำหรับงาน classification (การแบ่งหมวดหมู่)
***หมายเหตุ*****
linear regression กับ K-NN
นี้ก็คืออัลกอริทึมหนึ่งในวิชา machine learning (การเรียนรู้ของเครื่อง สาขาหนึ่งของ AI)
เด็กสมัยเนี่ยได้เรียนแหละนะ
.
.
👉 +++ บทที่ 4 การทำให้ข้อมูลเป็นภาพและสื่อสารด้วยข้อมูล +++
.
บทนี้ไม่อะไรมาก ลองนึกถึงนักวิทยาศาสตร์ หลังวิเคราะห์ข้อมูลอะไรมาเสร็จสรรพ เหลือขั้นสุดท้ายก็คือ การโชว์ให้คนอื่นดูด้วยการทำ data visualization (เรียกทับศัพท์ดีกว่า)
.
ในเนื้อหาก็จะยกตัวอย่างการใช้ แผนภูมิแท่ง,กราฟเส้น, แผนภูมิวงกลม, แผนการกระจาย
.
สุดท้ายที่ขาดไม่ได้ก็คือการเล่าเรื่องจากข้อมูล (data story telling) พร้อมข้อควระวังเวลานำเสนอข้อมูล
.
.
.
***หมายเหตุนี้ ***
😗 ภาษาโปรแกรมที่ตำราเรียน ม.5 กล่าวถึง และยกตัวอย่างมาให้ดู
ก็ได้แก่ python กับภาษา R
.
สำหรับภาษา R หลายคนอาจไม่คุ้น
คนจบไอทีอาจคุ้นกับ python มากกว่า
แต่ใครมาจากสายสถิติจะคุ้นแน่นอน
เพราะภาษา R นิยมมากในสายงานสถิติ
และสามารถนำมาใช้ในงาน data science ได้ง่ายและนิยมไม่แพ้ python
.
แต่ถ้าคนจาก data science จะขยับไปอีกสายหนึ่งของ AI
ก็คือ deep learning (การเรียนรู้เชิงลึก)
python จะนิยมแบบกินขาดครับ
.
===========
รีวิว ม.6
===========
เนื้อหาแบ่งเป็น 4 บท
👉 บทที่ 1 จะออกแนวสอนการเขียนบล็อก เพื่อเป็นบล็อกเกอร์
เนื้อหา ประกอบด้วย
1.1 องค์ประกอบและรูปแบบพื้นฐานในการสื่อสาร
1.1 เทคนิคและวิธีการแบ่งปันข้อมูล
1.1 ข้อควรระวังในการแบ่งปันข้อมูล
👉 บทที่ 2 อันนี้เด็ดดี
2.1 พูดถึงปัญญาประดิษฐ์ (AI), machine learning, deep learning
2.2 พูดถึงการประมวลผลแบบคลาวด์ (clound computing)
2.3 พูดถึง IoT (Internet of Things: IoT) อินเตอร์เน็ตของสรรพสิ่ง มียกตัวอย่าง smart city
2.4 เทคโนโลยีเสมือนจริง กลาวถึงเรื่อง AR ( Augmented Reality: AR) กับ VR (Virtual Reality: VR)
มีแถมเรื่อง block chain กับ quantum computer
.
แต่เนื้อหาเป็นการเกริ่นๆ เฉยๆ ไม่ได้ลงลึกอะไรมากแบบมหาลัยนะครับ
.
👉 บทที่ 3 พูดถึงการเป็นพลเมืองดิจิทัล
เนื้อหาประกอบไปด้วย
3.1 การเป็นพลเมืองดิจิทัล
3.2 การป้องกันตนเองและผู้อื่น
3.3 กฏหมายและมารยาทในสังคมดิจิทัล
.
👉 บทที่ 4 อาชีพในยุคดิจิทัล
เนื้อหาจะประกอบด้วย
4.1 อาชีพด้านเทคโนโลยีสารสนเทศและการสื่อสาร
4.2 การเปลี่ยนแปลงของเทคโนโลยีกับสังคมและอาชีพ
4.3 ผลกระทบของเทคโนโลยีกับอาชีพ
4.4 การทำงานร่วมกับเครื่องจักรและระบบอัตโนมัติ
สรุปแล้วเนื้อหาม.6
ตามความเห็น อ่านแล้วง่าย มันแค่เป็นการอธิบายภาพ
แต่ถ้าเป็นม.4 กับ ม.5 จะหนักกว่าหน่อย
.
ส่วนเนื้อหา ม.1 ม.2 ม.3 เดี่ยวมาเล่าให้ฟัง
แอบกระซิบบอกมี Python ด้วยแหละ
.
.
✍เขียนโดย โปรแกรมเมอร์ไทย thai programmer
👀 อ้างอิง
- วิทยาการคำนวณม.4
- วิทยาการคำนวณม. 5
- วิทยาการคำนวณม.6
.
.
++++++++++++++++++++++++++++=
ทิ้งท้ายในเมื่อ ม.6 มีพูดถึง AI หรือปัญญาประดิษฐ์
เผื่อน้องๆ สนใจอยากศึกษาเชิงลึก เป็นการปูพื้นฐานเรียนต่อมหาลัยจะได้ไม่งง
+++++ขอประชาสัมพันธ์ (ขายของ)
📔 หนังสือ "ปัญญาประดิษฐ์ (AI) ไม่ยาก" เข้าใจได้ด้วยเลขม. ปลาย (เนื้อหาภาษาไทย)
.
ถ้าสนใจสั่งซื้อเล่ม 1 ก็สั่งซื้อได้ที่ (เล่มอื่นๆ กำลังทยอยตามมา)
👉 https://www.mebmarket.com/web/index.php…
.
ขออภัยยังไม่มีเล่มกระดาษจำหน่าย มีแต่ ebook
.
ส่วนตัวอย่างหนังสือ ก็ดูได้ลิงค์นี้
👉 https://www.dropbox.com/s/fg8l38hc0k9b…/chapter_example.pdf…
data cleansing 在 prasertcbs Youtube 的最佳貼文
การอ่านข้อมูลที่อยู่ในรูปตาราง html ด้วย read_html จากหน้า web เช่น ข้อมูลตึกที่สูงที่สุดในโลกจาก Wikipedia
รู้จักกับ regular expression เบื้องต้น
การใช้ regex ในการลบตัวอักษรที่ไม่ใช่ตัวเลขออกจากข้อมูล
ดาวน์โหลด Jupyter Notebook ที่ใช้ในคลิปได้ที่: https://goo.gl/N6FHPN
เชิญสมัครเป็นสมาชิกของช่องนี้ได้ที่ ► https://www.youtube.com/subscription_center?add_user=prasertcbs
playlist สอน Python สำหรับ data science ► https://www.youtube.com/playlist?list=PLoTScYm9O0GFVfRk_MmZt0vQXNIi36LUz
playlist สอน seaborn ► https://www.youtube.com/playlist?list=PLoTScYm9O0GGC9QvLlrQGvMYatTjnOUwR
playlist สอน Jupyter Notebook ► https://www.youtube.com/watch?v=f3CLdRl-zyQ&list=PLoTScYm9O0GErrygsfQtDtBT4CloRkiDx
playlist สอน matplotlib ► https://www.youtube.com/playlist?list=PLoTScYm9O0GGRvUsTmO8MQUkIuM1thTCf
playlist สอนภาษาไพธอน Python เบื้องต้น ► https://www.youtube.com/watch?v=DI7eca5Kzdc&list=PLoTScYm9O0GH4YQs9t4tf2RIYolHt_YwW
playlist สอนภาษาไพธอน Python OOP การเขียนโปรแกรมเชิงวัตถุ ► https://www.youtube.com/watch?v=4bVBSluxJNI&list=PLoTScYm9O0GF_wbU-7layLaSuHjzhIRc9
playlist สอน Python 3 GUI ► https://www.youtube.com/playlist?list=PLoTScYm9O0GFB1Y3cCmb9aPD5xRB1T11y
playlist สอนการใช้งานโปรแกรม R: https://www.youtube.com/watch?v=UaEtZ5XzVeE&list=PLoTScYm9O0GGSiUGzdWbjxIkZqEO-O6qZ
playlist สอนการเขียนโปรแกรมภาษา R: https://www.youtube.com/playlist?list=PLoTScYm9O0GF6qjrRuZFSHdnBXD2KVICp
data cleansing 在 Hak Me Youtube 的最讚貼文
♥黑咪推介♥ 二百元以下平價化妝品好物
http://tinyurl.com/mjj7gbo
Product Featured (*Laughs* Some were bought so long ago that I don’t have the prices anymore, I will quote as much as I can):-
♥ Touch in Sol No Poreblem Primer HK$165
Available at Sasa
♥ L’Oreal Lucent Magique BB Essence Foundation SPF19 PA++ Color - 01 Porcelain $145
Available at Sasa/ Mannings/ Watsons
**used with Sigma F80 in the video HK$192 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/sigma
♥ Maybelline Dream Satin Skin SPF24 PA++ Color - 03 HK$139
Available at Sasa/ Watsons
**used with Sigma F80 in the video HK$192 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/sigma
♥ theBalm Sexy Mama HK$160
Available at 黑咪Hakme Beauty店
http://www.hakmebeauty.com/shop/brands/thebalm
♥ Beauty Cottage Loose Powder Color - 02 Soft Beige [Discontinued]
**used with Real Techniques Powder Brush in the video HK$98 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/real-techniques
♥ Heroine Make Smooth Cover Powder Mineral SPF32 PA++ Color - 02
Available at Logon/ Sasa
**used with Real Techniques Powder Brush in the video HK$98 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/real-techniques
♥ Revlon Age Defying Targeted Dark Spot Concealer Treatment HK$98
Available at Watsons
**used with Sigma 3DHD Precision Brush HK$152 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/sigma
♥ Makemania Data Eye Shadow Pen $79
Available at Sasa
♥ Beauty Cottage Sweet Lolita Eyeshadow Palette [Discontinued]
**used with Sigma Essential Kit HK$1,424 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/sigma
♥ theBalm California Face Palette HK$150
Available at 黑咪Hakme Beauty店
Review: http://tinyurl.com/nkrrlbl
http://www.hakmebeauty.com/shop/brands/thebalm
♥ Touch in Sol Dramatic Pencil Eyeliner Color - Antique Brown $89
Available at Sasa
♥ Heroine Make Long and Curl Mascara
Available at Sasa/ Logon
♥ Visee Lip & Cheek Cream Color PK-4 $85
Available at some Sasa
**used with Real Techniques Expert Brush HK$98 (Available at 黑咪Hakme Beauty店)
http://www.hakmebeauty.com/shop/brands/real-techniques
♥ Canmake Stay On Balm Rouge Color 03 $72
Available at some Sasa/ Logon
♥ Biore Makeup Remover Cleansing Water
Available at some Watsons/ Mannings
♥ Neutrogena Deep Clean Cleansing Lotion
Available at some Watsons/ Mannings
♥ Style Noble Black Head Sucking Gun $88
Available at Logon
♥ Beauty Cottage Seaweed Mineral Lip & Eye Remover
Bought from Thailand
♡黑咪店地址: http://www.hakmebeauty.com/store-locations
♡黑咪店Online: http://www.hakmebeauty.com/shop
♡黑咪店Instagram: @hakmebeauty
*************************************************************
Where To Find Me:-
♥ Blog: www.hakmebeauty.com
♥ Facebook: www.facebook.com/hakmebeauty
♥ Instagram: @iamhakme
♥ Snapchat: iamhakme
♥ Shop My Collection at Depop: @iamhakme
♥ Twitter: twitter.com/iamhakme
♥ Weibo: www.weibo.com/iamhakme
Disclaimer: This video is created by me and all the content are my thoughts. As always, all opinions are my own and honest. Products are either purchased by me or for those which are sent by PR are marked with an '*'. Some of the links used above might be affiliate links.
data cleansing 在 資料淨化- 維基百科,自由的百科全書 的相關結果
資料淨化(data cleaning)指刪除、更正資料庫中錯誤、不完整、格式有誤或多餘的資料。資料淨化不僅僅更正錯誤,同樣加強來自各個單獨資訊系統不同資料間的一致性。 ... <看更多>
data cleansing 在 Data Cleaning 介紹. 作為一個資料分析人員 - Medium 的相關結果
Data cleansing, data cleaning or data scrubbing is the process of detecting and correcting (or removing) corrupt or inaccurate records from a record set ... ... <看更多>
data cleansing 在 資料清洗(Data Cleansing) - iT 邦幫忙::一起幫忙解決難題 的相關結果
B-2.資料清洗(Data Cleansing): 清洗完整食材,將食材分為可吃及不可吃,將可吃的保留、不可吃的清洗掉或去除。 ... <看更多>