Beli Project AI +

Halo Ryan Blog

Mengenal Neighborhood Analysis dalam Algoritma KNN

Tim Halo Ryan, 24 Sep 2024

Neighborhood analysis dalam algoritma K-Nearest Neighbors (KNN) adalah proses menentukan "tetangga" terdekat dari suatu data yang ingin diprediksi juga seberapa erat (dekat) ketetanggaan mereka secara kolektif. KNN adalah algoritma berbasis instance yang bekerja dengan cara mencari titik-titik data terdekat di sekitar titik yang tidak diketahui, menggunakan metrik jarak seperti Euclidean Distance.

Neighborhood analysis dapat dilakukan secara terpisah pada setiap data maupun secara kolektif dalam bentuk grafik pada seluruh data uji untuk mengetahu seberapa baikl kualitas neighborhood kita. Contoh garafik hasil neighborhhod analysis adalah sebagai berikut:

Salah satu contoh Neighborhood Analysis dapat kalian pelajari pada project Sistem Rekomendasi Komposisi Tim Dota 2 pada modul dibawah ini:

Note:
Pelajari project Sistem Rekomendasi Komposisi Tim Dota 2 menggunakan algoritma KNN beserta 10 project machine learning lainnya dengan harga promo disini

Konsep Utama

  1. K: Jumlah tetangga yang dipertimbangkan dalam analisis (misalnya K = 3 berarti memperhitungkan 3 tetangga terdekat).
  2. Distance (Jarak): Metode untuk menghitung kedekatan antar titik data. Contoh jarak yang sering digunakan adalah Euclidean Distance, Manhattan Distance, atau Minkowski Distance.
  3. Proses Klasifikasi/Regresi: Setelah K tetangga terdekat ditemukan, KNN menghitung mayoritas label (untuk klasifikasi) atau rata-rata nilai (untuk regresi) dari tetangga tersebut untuk menentukan label atau nilai dari data yang baru.

Langkah-Langkah Neighborhood Analysis di KNN

  1. Hitung Jarak: Untuk data baru yang ingin diprediksi, hitung jarak dari data tersebut ke setiap titik data dalam dataset yang ada.
  2. Cari K Tetangga Terdekat: Pilih K data yang memiliki jarak paling dekat dengan data baru tersebut.
  3. Voting (untuk Klasifikasi): Lihat kelas dari K tetangga terdekat dan tentukan prediksi berdasarkan mayoritas kelas tetangga.
  4. Rata-rata (untuk Regresi): Ambil rata-rata dari nilai-nilai tetangga untuk prediksi nilai regresi.

Kelebihan dan Kekurangan Neighborhood Analysis di KNN

  • Kelebihan: Mudah dipahami dan tidak memerlukan asumsi distribusi data.
  • Kekurangan: KNN bisa lambat dengan dataset yang besar karena harus menghitung jarak untuk semua titik data.

Dengan neighborhood analysis, KNN mampu membuat prediksi berbasis data dengan melihat tetangga yang paling mirip, menjadikannya algoritma yang sederhana namun efektif untuk berbagai masalah klasifikasi dan regresi.

Baca Artikel Lainnya +