Spark และ Databricks: พื้นฐาน ETL สำหรับ Big Data — WalkSelf

Spark และ Databricks: พื้นฐาน ETL สำหรับ Big Data

เรียนรู้วิธีประมวลผลชุดข้อมูลขนาดใหญ่และสร้างไปป์ไลน์ ETL ที่เชื่อถือได้เพื่อเริ่มต้นเส้นทางวิศวกรรมข้อมูลของคุณ

⏱ 1 ชม. 10 นาที 📚 8 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

การจัดการและแปลงชุดข้อมูลขนาดใหญ่เป็นข้อกำหนดหลักสำหรับผู้เชี่ยวชาญด้านข้อมูลในปัจจุบัน เนื่องจากองค์กรสร้างข้อมูลมากกว่าที่เคย การทำความเข้าใจวิธีสร้างไปป์ไลน์ที่ปรับขนาดได้โดยใช้ Spark และ Databricks จึงกลายเป็นทักษะที่จำเป็นสำหรับวิศวกรข้อมูลและแมชชีนเลิร์นนิง หลักสูตรแบบข้อความพื้นฐานนี้จะแนะนำคุณตลอดแนวคิดหลักของการประมวลผลแบบกระจายและกระบวนการประมวลผลข้อมูลที่ทันสมัย คุณจะเปลี่ยนจากการทำความเข้าใจหลักการ Big Data พื้นฐานไปสู่การสร้างไปป์ไลน์ ETL (Extract, Transform, Load) ที่ใช้งานได้จริง ด้วยคำอธิบายที่เป็นลายลักษณ์อักษรโดยละเอียดและตัวอย่างโค้ดที่ใช้งานได้จริง คุณจะได้รับความมั่นใจในการจัดการกับความท้าทายด้านวิศวกรรมข้อมูลในโลกแห่งความเป็นจริง สิ่งที่คุณจะได้เรียนรู้: • ทำความเข้าใจแนวคิดพื้นฐานของการประมวลผลข้อมูลแบบกระจายและการประมวลผลแบบคลัสเตอร์ • นำทางในพื้นที่ทำงานของ Databricks เพื่อเขียนและรันสคริปต์การประมวลผลข้อมูลที่แข็งแกร่ง • ประมวลผลชุดข้อมูลขนาดใหญ่โดยใช้การดำเนินการ Spark DataFrame ที่ทันสมัยและคิวรี SQL • สร้างไปป์ไลน์ ETL ที่สมบูรณ์เพื่อดึงข้อมูล แปลงข้อมูล และโหลดข้อมูลได้อย่างน่าเชื่อถือ • ประยุกต์ใช้แนวคิด Data Lakehouse ที่ทันสมัย รวมถึงการแนะนำเบื้องต้นเกี่ยวกับหลักการ Delta Lake • ฝึกฝนเทคนิคการทำความสะอาดข้อมูล การตรวจสอบความถูกต้อง และการแปลงข้อมูลผ่านแบบฝึกหัดที่เป็นลายลักษณ์อักษรพร้อมคำแนะนำ หลักสูตรเริ่มต้นด้วยคำศัพท์ Big Data ที่จำเป็นและคำจำกัดความพื้นฐาน ก่อนที่จะเข้าสู่การประยุกต์ใช้การเขียนโค้ดจริง คุณจะก้าวหน้าไปทีละขั้นตอนผ่านสื่อการอ่าน โดยนำความรู้ใหม่ของคุณไปใช้เพื่อสร้างไปป์ไลน์ข้อมูลที่สมบูรณ์ตั้งแต่เริ่มต้น หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นโดยเฉพาะ ไม่จำเป็นต้องมีประสบการณ์มาก่อนกับระบบแบบกระจายหรือเครื่องมือ Big Data เริ่มอ่านวันนี้เพื่อสร้างทักษะวิศวกรรมข้อมูลพื้นฐานของคุณและประมวลผล Big Data ด้วยความมั่นใจ

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 10 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (2)

Iwan Setiawan ID ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2025-09-09T07:34:48+00:00

Materi soal membangun pipeline ETL di Databricks dan optimasi partisi Spark sangat membantu pekerjaan harian saya. Sedikit berharap bagian streaming dibahas lebih dalam, tapi secara keseluruhan layak diikuti.

علي بن عبدالله بن علي BH
★ 5 · 2025-04-20T10:52:21+00:00

كنت أتهيب التعامل مع البيانات الضخمة قبل هذه الدورة، لكن الشرح جعل الأمور أبسط بكثير. أعجبني كيف بُنيت خطوات الـ ETL خطوة بخطوة على Databricks، والفرق بين العمليات التي تُنفّذ بشكل كسول والإجراءات صار واضحاً أخيراً. تمارين معالجة ملفات Parquet كانت عملية جداً وقريبة من الواقع. الآن أشعر بثقة لأبدأ مساري في هندسة البيانات، وأنصح بها بشدة لكل مبتدئ.

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม