Confusion matrix adalah sebuah tabel yang digunakan untuk mengukur performa dari sebuah model klasifikasi dengan cara membandingkan hasil prediksi dari mesin dengan label yang sebenarnya. Misal kita memiliki model klasifikasi peluang kematian akibat serangan jantung yang memiliki dua buah label yaitu "death" (1) dan "alive" (0), maka hasilnya akan menjadikan sebuah tabel confusion matrix berukuran 2 x 2 (karena jumlah tabel prediksinya ada 2. Lalu bagaimana jika kita memiliki 3 kelas atau lebih yang menghasilkan confusion matrix n x n?
Baca Juga: Cara Membaca Confusion Matrix 2 x 2 disini
Dalam kasus matriks 3x3, tiga kelas berbeda (misalnya A, B, dan C) digunakan. Setiap elemen dalam matriks mewakili jumlah prediksi model dibandingkan dengan nilai aktual, dengan baris merepresentasikan kelas yang sebenarnya dan kolom menunjukkan prediksi dari model. Diagonal utama dalam confusion matrix menunjukkan prediksi yang benar, sedangkan elemen lain di luar diagonal mewakili kesalahan prediksi.
Salah-satu contoh confusion matrix 3 x 3 adalah seperti berikut:
Cara Membaca:
Confusion matrix memiliki 4 komponen penting, yaitu TP, FP, FN, dan TN. Namun teknik analisisnya berbeda dengan teknik menganalisis confusion matrix 2x2. TP, FP, FN, dan TN pada Confusion matrix 3x3 atau lebih digenerasi per label. Artinya pada label 'A' akan memiliki TP, FP, FN dan TN sendiri yang berbeda dengan label lainnya. Kira-kira penjelasannya seperti ini?
Begitu juga pada label-label lainnya. TP, FP, FN dan TN harus dihitung ulang secara manual berdasarkan label. Bingung? Ayo kita lihat contoh cara membacanya pada sub bab berikut.
Pada bagian ini kita akan mencoba menerjemahkan confusion matrix diatas menjadi TP, FP, FN dan TN. Pertama-tama akan kita mulai dari Label 'A' terlebih dahulu. Dari confusion matrix diatas, dapat disimpulkan bahwa:
Nah, kemudian dengan cara yang sama, dilanjutkan untuk membaca TP, FP, FN dan TN pada label 'B' dan 'C'.
Contoh dari confusion matrix yang memiliki dimensi 4x4 atau lebih dapat kalian lihat pada gambar dibawah ini:
Note:
Gambar diatas adalah confusion matrix yang dihasilkan dari model prediksi cuaca menggunakan algoritma sistem pakar (decision tree). Kalian bisa membeli projectnya bersama 10 project machine learning lainnya dengan harga promo disini.
Pada confusion matrix 4x4 atau lebih, cara mencari TP, FP, FN dan TN sama persis dengan confusion matrix 3x3, yaitu dengan menganalisis per label hingga selesai pada semua label. So, artinya kita akan punya nilai precision, recall dan f1-score sendiri-sendiri pada setiap label.
Selanjutnya kita akan belajar cara menghitung precision, recall dan f1-score pada confusion matrix 3x3 atau lebih. Namun kita tidak akan menindaklanjutinya pada artikel ini ya. Kalau kalian mau tau cara menghitungnya, kalian bisa membaca artikel dibawah ini:
Baca Juga: Cara Menghitung Precision, Recall & F1-Score Pada Confusion Matrix 3x3 Atau Lebih disini
Confusion matrix untuk model klasifikasi multi-kelas (seperti 3x3 atau lebih) memberi pandangan mendalam tentang performa model. Dengan menganalisis True Positives, False Positives, True Negatives, dan False Negatives, kita bisa menghitung berbagai metrik seperti precision, recall, accuracy, dan F1-score untuk mendapatkan gambaran menyeluruh tentang efektivitas model dalam berbagai kelas.
Memahami cara membaca dan menganalisis confusion matrix sangat penting untuk meningkatkan model klasifikasi dan memastikan bahwa model tersebut sesuai untuk tujuan tertentu.
Dalam kasus matriks 3x3, tiga kelas berbeda (misalnya A, B, dan C) digunakan. Setiap elemen dalam matriks mewakili jumlah prediksi model dibandingkan dengan nilai aktual, dengan baris merepresentasikan...