Course Content
Pengenalan Data Mining
Dengan materi ini, peserta diharapkan dapat memahami konsep dasar data mining, proses yang terlibat, dan Sejarah singkat Data Mining.
0/5
Lingkungan Kerja dan Instalasi
Dengan materi ini, peserta diharapkan dapat mengatur lingkungan kerja mereka untuk data mining menggunakan Python dan memahami dasar-dasar penggunaan Jupyter Notebook serta pustaka yang diperlukan.
0/5
Pengumpulan dan Pembersihan Data
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan proses pengumpulan serta pembersihan data menggunakan Python.
0/4
Exploratory Data Analysis (EDA)
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan teknik eksplorasi data untuk memperoleh wawasan awal dari dataset mereka.
0/6
Teknik Data Mining Dasar
Dengan materi ini, peserta diharapkan dapat memahami teknik dasar data mining, termasuk klasifikasi, regresi, dan clustering, serta cara mengevaluasi model-model tersebut.
0/5
Penutup
peserta diharapkan dapat memahami capaian dari kursus dan mengenali keterampilan yang telah diperoleh untuk pengembangan keterampilan lebih lanjut.
0/1
Dasar Data Mining Menggunakan Python
About Lesson

Menemukan Pola dan Anomali

Pola:

  • Korelasi Antar Variabel: 

           correlation = data.corr()
           print(correlation)

  • Analisis Tren Waktu (jika data bersifat temporal):

          data[‘date_column’] = pd.to_datetime(data[‘date_column’])
          data.set_index(‘date_column’).resample(‘M’).mean().plot()
          plt.show()

Anomali:

  • Deteksi Outlier dengan Box Plot: 

           sns.boxplot(data[‘numeric_column’])
           plt.show()

  • Menentukan Outlier:

          Q1 = data[‘numeric_column’].quantile(0.25)
          Q3 = data[‘numeric_column’].quantile(0.75)
          IQR = Q3 – Q1
          outliers = data[(data[‘numeric_column’] < (Q1 – 1.5 * IQR)) | (data[‘numeric_column’] > (Q3 + 1.5 * IQR))]