Course Content
Pengenalan Data Mining
Dengan materi ini, peserta diharapkan dapat memahami konsep dasar data mining, proses yang terlibat, dan Sejarah singkat Data Mining.
0/5
Lingkungan Kerja dan Instalasi
Dengan materi ini, peserta diharapkan dapat mengatur lingkungan kerja mereka untuk data mining menggunakan Python dan memahami dasar-dasar penggunaan Jupyter Notebook serta pustaka yang diperlukan.
0/5
Pengumpulan dan Pembersihan Data
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan proses pengumpulan serta pembersihan data menggunakan Python.
0/4
Exploratory Data Analysis (EDA)
Dengan materi ini, peserta diharapkan dapat memahami dan menerapkan teknik eksplorasi data untuk memperoleh wawasan awal dari dataset mereka.
0/6
Teknik Data Mining Dasar
Dengan materi ini, peserta diharapkan dapat memahami teknik dasar data mining, termasuk klasifikasi, regresi, dan clustering, serta cara mengevaluasi model-model tersebut.
0/5
Penutup
peserta diharapkan dapat memahami capaian dari kursus dan mengenali keterampilan yang telah diperoleh untuk pengembangan keterampilan lebih lanjut.
0/1
Dasar Data Mining Menggunakan Python
About Lesson

Regresi

Apa itu Regresi? Regresi adalah teknik yang digunakan untuk memodelkan hubungan antara variabel independen dan variabel dependen. Digunakan untuk prediksi nilai kontinu.

Regresi Linier:

  • Model yang memprediksi nilai variabel target dengan menghubungkan variabel independen dengan garis lurus.
  • Implementasi dengan Scikit-learn:

          from sklearn.linear_model import LinearRegression
          from sklearn.model_selection import train_test_split
          from sklearn.metrics import mean_squared_error

          # Memuat data
          X = data[[‘feature1’, ‘feature2’]]
          y = data[‘target’]

         # Membagi data
          X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

         # Membuat dan melatih model
         model = LinearRegression()
         model.fit(X_train, y_train)

        # Membuat prediksi
        y_pred = model.predict(X_test)

        # Mengukur kinerja model
        mse = mean_squared_error(y_test, y_pred)
        print(f’Mean Squared Error: {mse:.2f}’)