Course Content
Pengenalan Data Mining
Dengan materi ini, peserta diharapkan dapat memahami konsep dasar data mining, proses yang terlibat, dan Sejarah singkat Data Mining.
0/5
Lingkungan Kerja dan Instalasi
Dengan materi ini, peserta diharapkan dapat mengatur lingkungan kerja mereka untuk data mining menggunakan Python dan memahami dasar-dasar penggunaan Jupyter Notebook serta pustaka yang diperlukan.
0/5
Pengumpulan dan Pembersihan Data
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan proses pengumpulan serta pembersihan data menggunakan Python.
0/4
Exploratory Data Analysis (EDA)
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan teknik eksplorasi data untuk memperoleh wawasan awal dari dataset mereka.
0/6
Teknik Data Mining Dasar
Dengan materi ini, peserta diharapkan dapat memahami teknik dasar data mining, termasuk klasifikasi, regresi, dan clustering, serta cara mengevaluasi model-model tersebut.
0/5
Penutup
peserta diharapkan dapat memahami capaian dari kursus dan mengenali keterampilan yang telah diperoleh untuk pengembangan keterampilan lebih lanjut.
0/1
Dasar Data Mining Menggunakan Python
About Lesson

Klasterisasi

Apa itu Klasterisasi? Klasterisasi adalah teknik yang digunakan untuk mengelompokkan data ke dalam grup atau cluster yang mirip. Tidak memerlukan label data sebelumnya dan digunakan untuk menemukan struktur dalam data.

k-Means Clustering:

  • Algoritma yang membagi data ke dalam k cluster dengan cara meminimalkan jarak antara data dan pusat cluster.
  • Implementasi dengan Scikit-learn:

          from sklearn.cluster import KMeans
          import matplotlib.pyplot as plt

          # Memuat data
          X = data[[‘feature1’, ‘feature2’]]

          # Membuat dan melatih model
          model = KMeans(n_clusters=3, random_state=42)
          model.fit(X)

          # Menambahkan label cluster ke data
          data[‘cluster’] = model.labels_

          # Visualisasi hasil clustering
          plt.scatter(data[‘feature1’], data[‘feature2’], c=data[‘cluster’], cmap=’viridis’)
          plt.xlabel(‘Feature 1’)
          plt.ylabel(‘Feature 2’)
          plt.title(‘k-Means Clustering’)
          plt.show()