Course Content
Pengenalan Data Mining
Dengan materi ini, peserta diharapkan dapat memahami konsep dasar data mining, proses yang terlibat, dan Sejarah singkat Data Mining.
0/5
Lingkungan Kerja dan Instalasi
Dengan materi ini, peserta diharapkan dapat mengatur lingkungan kerja mereka untuk data mining menggunakan Python dan memahami dasar-dasar penggunaan Jupyter Notebook serta pustaka yang diperlukan.
0/5
Pengumpulan dan Pembersihan Data
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan proses pengumpulan serta pembersihan data menggunakan Python.
0/4
Exploratory Data Analysis (EDA)
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan teknik eksplorasi data untuk memperoleh wawasan awal dari dataset mereka.
0/6
Teknik Data Mining Dasar
Dengan materi ini, peserta diharapkan dapat memahami teknik dasar data mining, termasuk klasifikasi, regresi, dan clustering, serta cara mengevaluasi model-model tersebut.
0/5
Penutup
peserta diharapkan dapat memahami capaian dari kursus dan mengenali keterampilan yang telah diperoleh untuk pengembangan keterampilan lebih lanjut.
0/1
Dasar Data Mining Menggunakan Python

Regresi

Apa itu Regresi? Regresi adalah teknik yang digunakan untuk memodelkan hubungan antara variabel independen dan variabel dependen. Digunakan untuk prediksi nilai kontinu.

Regresi Linier:

  • Model yang memprediksi nilai variabel target dengan menghubungkan variabel independen dengan garis lurus.
  • Implementasi dengan Scikit-learn:

          from sklearn.linear_model import LinearRegression
          from sklearn.model_selection import train_test_split
          from sklearn.metrics import mean_squared_error

          # Memuat data
          X = data[[‘feature1’, ‘feature2’]]
          y = data[‘target’]

         # Membagi data
          X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

         # Membuat dan melatih model
         model = LinearRegression()
         model.fit(X_train, y_train)

        # Membuat prediksi
        y_pred = model.predict(X_test)

        # Mengukur kinerja model
        mse = mean_squared_error(y_test, y_pred)
        print(f’Mean Squared Error: {mse:.2f}’)