Menemukan Pola dan Anomali
Pola:
- Korelasi Antar Variabel:
correlation = data.corr()
print(correlation)
- Analisis Tren Waktu (jika data bersifat temporal):
data[‘date_column’] = pd.to_datetime(data[‘date_column’])
data.set_index(‘date_column’).resample(‘M’).mean().plot()
plt.show()
Anomali:
- Deteksi Outlier dengan Box Plot:
sns.boxplot(data[‘numeric_column’])
plt.show()
- Menentukan Outlier:
Q1 = data[‘numeric_column’].quantile(0.25)
Q3 = data[‘numeric_column’].quantile(0.75)
IQR = Q3 – Q1
outliers = data[(data[‘numeric_column’] < (Q1 – 1.5 * IQR)) | (data[‘numeric_column’] > (Q3 + 1.5 * IQR))]