Beli Project AI +

Halo Ryan Blog

Cara Membaca Confusion Matrix Sederhana 2 x 2

Tim Halo Ryan, 22 Sep 2024

Confusion matrix adalah sebuah tabel yang digunakan untuk mengukur performa dari sebuah model klasifikasi dengan cara membandingkan hasil prediksi dari mesin dengan label yang sebenarnya. Misal kita memiliki model klasifikasi peluang kematian akibat serangan jantung yang memiliki dua buah label yaitu "death" (1) dan "alive" (0), maka hasilnya akan menjadikan sebuah tabel confusion matrix berukuran 2 x 2 (karena jumlah tabel prediksinya ada 2.

Nah, confusion matrix ini nantinya akan digunakan untuk mendefinisikan performa mesin dan lebih banyak metric lainnya seperti: akurasi, precission, recall, sensitifitas dan spesifitas. So, kita akan mempelajarinya disini.

Contoh Confusion Matrix 2 x 2

Seperti yang sudah dijelaskan diatas bahwa confusion matrix membandingkan nilai (label) hasil prediksi dengan label yang sebenarnya. Misalkan kita memiliki 15 data testing dengan dua buah label yang akan coba di prediksi labelnya oleh mesin, kemudian akan dibandingkan dengan label sebenarnya dari 15 data tersebut. Hasilnya adalah sebagai berikut:

Nah pada gambar diatas, kita bisa lihat bahwa data ke-1 (data pertama) secara aktual memiliki label '0' (alive), tapi malah diprediksi '1' (death) oleh mesin. Artinya disini mesin salah dalam melakukan prediksi. Tingkat kesalahan ini disebut False Positive (FP). Nah sementara pada data ke-2 secara aktual memiliki label '1' (death) dan berhasil diprediksi '1' (death) oleh mesin. Nah tingkat keakuratan ini disebut True Positive (TP).

Nah, dari hasil perbandingan label aktual dengan hasil prediksi diatas dapat dibuat menjadi confusion metric sebagai berikut:

Mudah bukan cara membuatnya? Jadi dari tabel panjang pada gambar pertama kemudian diringkas menjadi seperti gambar kedua.

Cara Membaca Confusion Matrix 2 x 2

Dari data diatas, kita bisa melihat ada 6 data dengan label '1' (positif) yang berhasil diprediksi '1' (positif) juga oleh mesin. Nah, kelompok data ini disebut True Positive (TP). Kemudian ada 4 data dengan label '0' (negatif) yang berhasil diprediksi '0' (negatif) juga oleh mesin. Kelompok data ini disebut True Negative (TN). Kemudian ada 2 data dengan label '0' (negatif) yang diprediksi '1' positif oleh mesin. Nah, kelompok data ini disebut False Positive (FP). Terakhir ada 3 data dengan label '1' (positif) yang diprediksi '0' (negatif) oleh mesin. Kelompok data ini disebut False Negative (FN).

Bagian-Bagian Confusion Matrix 2 x 2

Nah dari-tadi kan kita udah banyak nyebut-nyebut TP, TN, FP, dan FN ya, apa sih itu dan bagaimana posisinya dalam confusion matrix? Secara umum, bagian-bagian dari confusion matrix 2 x 2 adalah seperti berikut:


Secara sederhana, confusion matrix diatas terdiri dari empat komponen, antara lain:

  1. True Positive (TP): Ini adalah kasus di mana model memprediksi benar, yaitu memprediksi kelas "Positif" dan memang sebenarnya datanya juga "Positif". Contohnya, model memprediksi seseorang sakit dan kenyataannya memang orang tersebut sakit.
  2. True Negative (TN): Ini adalah kasus di mana model memprediksi benar juga, tetapi untuk kelas "Negatif". Artinya, model memprediksi "Negatif" dan memang benar data aslinya "Negatif". Misalnya, model memprediksi seseorang sehat, dan kenyataannya orang tersebut memang sehat.
  3. False Positive (FP): Ini adalah kesalahan prediksi di mana model memprediksi "Positif" padahal sebenarnya "Negatif". Istilah lainnya adalah Type I Error (Error Tipe 1). Misalnya, model memprediksi seseorang sakit, tetapi sebenarnya orang tersebut sehat.
  4. False Negative (FN): Ini adalah kesalahan prediksi di mana model memprediksi "Negatif" padahal sebenarnya "Positif". Istilah lainnya adalah Type II Error (Error Tipe 2). Misalnya, model memprediksi seseorang sehat, padahal orang tersebut sebenarnya sakit.

Mengapa Confusion Matrix Penting?

Confusion matrix membantu kita memahami seberapa baik model kita bekerja dengan melihat hasil prediksi yang benar dan salah. Tabel ini membandingkan hasil prediksi model dengan hasil sebenarnya (data yang benar). Confusion matrix penting karena tidak hanya memberikan informasi tentang berapa banyak prediksi yang benar, tetapi juga jenis kesalahan yang dibuat oleh model. Dengan melihat confusion matrix, kita bisa menghitung beberapa metrik penting seperti: akurasi, precision, recall & f1-score.

Baca Juga: Apa Itu Precision, Recall & F1-Score, Rumus & Cara Menghitungnya disini

Dengan confusion matrix, kita bisa mengetahui seberapa baik model kita tidak hanya dalam memprediksi dengan benar, tapi juga dalam menghindari kesalahan yang bisa berdampak pada pengambilan keputusan.

Baca Juga:

001

Apa Itu Akurasi, Precision, Recall & F1-Score,...

Artikel Machine Learning

Karena akurasi, precision, recall dan f1-score sangat erat kaitannya dengan confusion matrix, maka saya akan sangat menganjurkan kamu untuk memahami terlebih dahulu apa itu confusion matrix pada artikel...

Selengkapnya arrow_forward

002

Apa Perbedaan Sensitifitas & Spesifitas Pada Machine...

Artikel Machine Learning

Alumni Covid? Sini kumpul. Selama masa covid kemaren, kalian pasti sering banget mendengar istilah sensitifitas dan spesifitas bukan? Terutama yang berkaitan dengan alat deteksi covid atau keakurasian swab...

Selengkapnya arrow_forward

Baca Artikel Lainnya +