Beli Project AI +
Download Dataset

Dataset
Halo Ryan

SemEval 2016 Dataset Task 6 For Sentiment Analysis

Made with by Halo Ryan

Dataset - Halo Ryan

Dataset - SemEval 2016 Dataset Task 6 For Sentiment Analysis

Tim Halo Ryan, 04 Dec 2024

Sentiment Analysis adalah cabang dari analisis teks yang berfokus pada identifikasi dan ekstraksi emosi atau opini yang terkandung dalam teks. Tujuannya adalah untuk menentukan apakah sentimen atau opini yang diungkapkan dalam teks bersifat positif, negatif, atau netral. Sentiment analysis juga sering disebut sebagai opinion mining.

Dataset ini berisi dataset yang disadur dari SamEval dataset 2016 task 6 untuk keperluan kemudahan dalam pembelajaran. Berkas tersebut berisi anotasi sentimen mentah untuk tweet yang digunakan dalam SemEval-2016 Task 6 'Detecting Stance in Tweets'. Anotasi sentimen tersebut bukan bagian dari tugas bersama SemEval-2016, tetapi tersedia untuk penelitian di masa mendatang.

Keterangan

KolomTipe DataKeterangan
Worker IDTextID untuk pekerja kerumunan; untuk menjaga privasi, kami mengganti ID pekerja CrowdFlower dengan ID berurutan, tetapi tetap menggunakan ID yang sama untuk semua anotasi yang dilakukan oleh pekerja tertentu
Instance IDTextID untuk tweet yang dianotasi; ID tersebut sama dengan yang digunakan dalam kumpulan data pelatihan dan pengujian SemEval-2016 Task 6
TweetTextText Tweet
SentimentText / Categoricaladalah jawaban pekerja untuk pertanyaan berikut: 'Bahasa apa yang digunakan pembicara?' Jawaban yang mungkin adalah:
  1. pembicara menggunakan bahasa positif, misalnya, ungkapan dukungan, kekaguman, sikap positif, pengampunan, pembinaan, keberhasilan, keadaan emosi positif (kebahagiaan, optimisme, kebanggaan, dll.)
  2. pembicara menggunakan bahasa negatif, misalnya, ungkapan kritik, penilaian, sikap negatif, mempertanyakan validitas/kompetensi, kegagalan, keadaan emosi negatif (kemarahan, frustrasi, kesedihan, kecemasan, dll.)
  3. pembicara menggunakan ungkapan sarkasme, ejekan, atau ejekan
  4. pembicara menggunakan bahasa positif sebagian dan bahasa negatif sebagian
  5. pembicara tidak menggunakan bahasa positif maupun negatif.

Citation

Mohammad, S., Sobhani, P., Kiritchenko, S. (2017). Stance and Sentiment in Tweets. ACM Transactions on Internet Technology, 17(3), 2017.

Kalian juga bisa melihat versi aslinya disini

Penggunaan

Ada dua cara untuk menggunakan dataset ini, pertama kalian bisa download dan upload ulang datasetnya kedalam proyek kalian, dan kedua melakukan penarikan langsung (fork) dari CDN Halo Ryan di proyek google colab kalian seperti ini:

Download: Dataset SamEval 2016 Task6 Sentiment :

!wget --no-check-certificate https://cdn.haloryan.com/dataset/sam_eval_2016_task_6_sentiment.csv
import pandas as pd

df = pd.read_csv('sam_eval_2016_task_6_sentiment.csv')
df

Download Dataset