Dataset
Halo Ryan
Credit Card Fraud Detection
Tim Halo Ryan, 19 Aug 2024
Dataset ini berisi kumpulan data transaksi kartu kredit yang dilakukan oleh pemegang kartu kredit dari berbagai bank di Eropa pada tahun 2023. Dataset ini terdiri dari lebih dari 550.000 data, dan data telah dianonimkan serta dilakukan dekomposisi untuk melindungi identitas pemegang kartu. Dataset ini dapat digunakan untuk membuat pemodelan machine learning khususnya untuk mendeteksi sebuah transaksi yang terindikasi atau berpotensi fraud.
Keterangan
Kolom | Tipe Data | Keterangan |
id | Numeric | Kode identitas unik dari setiap transaksi yang dilakukan. Kode ini berbeda antara satu transaksi dengan transaksi lainnya. Cenderung tidak digunakan dalam pemrosesan data. |
V1-V28 | Numeric | Fitur anonim yang merepresentasikan atribut dari setiap transaksi. Sengaja dianonimkan untuk melindungi data nasabah. Nilai dari fitur ini juga bukan merupakan nilai yang sebenarnya, melainkan sudah didekomposisi. |
Amount | Numeric | Nilai (harga) transaksi |
Class | Boolean | Label indikasi fraud. Nilai '1' artinya terindikasi fraud, nilai '0' tidak terindikasi fraud. |
Ada dua cara untuk menggunakan dataset ini, pertama kalian bisa download dan upload ulang datasetnya kedalam proyek kalian, dan kedua melakukan penarikan langsung (fork) dari CDN Halo Ryan di proyek google colab kalian seperti ini:
Download: Dataset Credit Card Fraud Detection :
!wget --no-check-certificate https://cdn.haloryan.com/dataset/creditcard.csv
import pandas as pd
df = pd.read_csv('creditcard.csv')
df