Beli Project AI +

Halo Ryan Blog

Cara Membaca Confusion Matrix 3x3 Atau Lebih

Tim Halo Ryan, 24 Sep 2024

Confusion matrix adalah sebuah tabel yang digunakan untuk mengukur performa dari sebuah model klasifikasi dengan cara membandingkan hasil prediksi dari mesin dengan label yang sebenarnya. Misal kita memiliki model klasifikasi peluang kematian akibat serangan jantung yang memiliki dua buah label yaitu "death" (1) dan "alive" (0), maka hasilnya akan menjadikan sebuah tabel confusion matrix berukuran 2 x 2 (karena jumlah tabel prediksinya ada 2. Lalu bagaimana jika kita memiliki 3 kelas atau lebih yang menghasilkan confusion matrix n x n?

Baca Juga: Cara Membaca Confusion Matrix 2 x 2 disini

Dalam kasus matriks 3x3, tiga kelas berbeda (misalnya A, B, dan C) digunakan. Setiap elemen dalam matriks mewakili jumlah prediksi model dibandingkan dengan nilai aktual, dengan baris merepresentasikan kelas yang sebenarnya dan kolom menunjukkan prediksi dari model. Diagonal utama dalam confusion matrix menunjukkan prediksi yang benar, sedangkan elemen lain di luar diagonal mewakili kesalahan prediksi.

Contoh Confusion Matrix 3x3

Salah-satu contoh confusion matrix 3 x 3 adalah seperti berikut:

Cara Membaca:

  1. Ada 50 data label 'A' yang berhasil diprediksi sebagai label 'A'. Sementara 5 data yang sebenarnya label 'A' malah diprediksi label 'B' dan 10 data yang sebenarnya label 'A' malah diprediksi label 'C'.
  2. Ada 40 data label 'B' yang berhasil diprediksi sebagai label 'B'. Sementara 4 data yang sebenarnya label 'B' malah diprediksi sebagai label 'A' dan 8 data yang sebenarnya adalah label 'B' malah diprediksi sebagai label 'C'.
  3. Ada 35 data label 'C' yang berhasil diprediksi sebagai label 'C'. Namun ada 7 data yang sebenarnya label 'C' malah diprediksi sebagai label 'A' dan ada 6 data yang sebenarnya label 'C' yang malah diprediksi sebagai label 'B'.

Komponen Penting Dalam Confusion Matrix 3x3

Confusion matrix memiliki 4 komponen penting, yaitu TP, FP, FN, dan TN. Namun teknik analisisnya berbeda dengan teknik menganalisis confusion matrix 2x2. TP, FP, FN, dan TN pada Confusion matrix 3x3 atau lebih digenerasi per label. Artinya pada label 'A' akan memiliki TP, FP, FN dan TN sendiri yang berbeda dengan label lainnya. Kira-kira penjelasannya seperti ini?

  1. True Positives (TP): Jumlah prediksi yang benar untuk kelas tertentu. Contoh: Model memprediksi kelas A, dan nilai aktualnya juga A.
  2. False Positives (FP): Jumlah kasus di mana model memprediksi kelas tertentu, tetapi sebenarnya salah. Contoh: Model memprediksi kelas A, tetapi nilai sebenarnya adalah kelas B atau C.
  3. False Negatives (FN): Jumlah kasus di mana model gagal memprediksi kelas yang benar, sebaliknya memprediksi kelas lain. Contoh: Model memprediksi kelas B atau C, tetapi seharusnya kelas A.
  4. True Negatives (TN): Jumlah prediksi di mana model secara benar tidak memprediksi kelas tertentu. Contoh: Model tidak memprediksi kelas A, dan data sebenarnya juga bukan kelas A, melainkan kelas B atau C.

Begitu juga pada label-label lainnya. TP, FP, FN dan TN harus dihitung ulang secara manual berdasarkan label. Bingung? Ayo kita lihat contoh cara membacanya pada sub bab berikut.

Cara Membaca Confusion Matrix 3x3

Pada bagian ini kita akan mencoba menerjemahkan confusion matrix diatas menjadi TP, FP, FN dan TN. Pertama-tama akan kita mulai dari Label 'A' terlebih dahulu. Dari confusion matrix diatas, dapat disimpulkan bahwa:

  • True Positives (TP) untuk kelas A = 50 (prediksi A tepat untuk kasus A).
  • False Positives (FP) untuk kelas A = 4 (prediksi A, tetapi sebenarnya kelas B) dan 7 (prediksi A, tetapi sebenarnya kelas C), jadi total FP untuk A = 11.
  • False Negatives (FN) untuk kelas A = 5 (seharusnya prediksi A, tetapi salah diprediksi sebagai B) dan 10 (diprediksi sebagai C), jadi total FN untuk A = 15.
  • True Negatives (TN) untuk A = 40 + 35 = 75 (prediksi bukan A, dan data memang bukan A).

Nah, kemudian dengan cara yang sama, dilanjutkan untuk membaca TP, FP, FN dan TN pada label 'B' dan 'C'.

Confusion Matrix 4x4 Atau Lebih

Contoh dari confusion matrix yang memiliki dimensi 4x4 atau lebih dapat kalian lihat pada gambar dibawah ini:

Note:
Gambar diatas adalah confusion matrix yang dihasilkan dari model prediksi cuaca menggunakan algoritma sistem pakar (decision tree). Kalian bisa membeli projectnya bersama 10 project machine learning lainnya dengan harga promo disini.

Pada confusion matrix 4x4 atau lebih, cara mencari TP, FP, FN dan TN sama persis dengan confusion matrix 3x3, yaitu dengan menganalisis per label hingga selesai pada semua label. So, artinya kita akan punya nilai precision, recall dan f1-score sendiri-sendiri pada setiap label.

What's Next?

Selanjutnya kita akan belajar cara menghitung precision, recall dan f1-score pada confusion matrix 3x3 atau lebih. Namun kita tidak akan menindaklanjutinya pada artikel ini ya. Kalau kalian mau tau cara menghitungnya, kalian bisa membaca artikel dibawah ini:

Baca Juga: Cara Menghitung Precision, Recall & F1-Score Pada Confusion Matrix 3x3 Atau Lebih disini

Kesimpulan

Confusion matrix untuk model klasifikasi multi-kelas (seperti 3x3 atau lebih) memberi pandangan mendalam tentang performa model. Dengan menganalisis True Positives, False Positives, True Negatives, dan False Negatives, kita bisa menghitung berbagai metrik seperti precision, recall, accuracy, dan F1-score untuk mendapatkan gambaran menyeluruh tentang efektivitas model dalam berbagai kelas.

Memahami cara membaca dan menganalisis confusion matrix sangat penting untuk meningkatkan model klasifikasi dan memastikan bahwa model tersebut sesuai untuk tujuan tertentu.

Baca Juga:

001

Precision, Recall & F1-Score Confusion Matrix 3x3

Artikel Machine Learning

Dalam kasus matriks 3x3, tiga kelas berbeda (misalnya A, B, dan C) digunakan. Setiap elemen dalam matriks mewakili jumlah prediksi model dibandingkan dengan nilai aktual, dengan baris merepresentasikan...

Selengkapnya arrow_forward

Baca Artikel Lainnya +