DEV Community

Cover image for Dataset Al-Qur'an dan Sunnah untuk Penelitian Islami
Ronnie Aban
Ronnie Aban

Posted on

Dataset Al-Qur'an dan Sunnah untuk Penelitian Islami

Dataset dirancang untuk mendukung penelitian berbasis Natural Language Processing (NLP) dan dapat diakses secara gratis di platform Hugging Face dan Kaggle.

1. Dataset Al-Qur'an Bahasa Arab dan Terjemahan Indonesia 

Deskripsi

Dataset ini mencakup teks lengkap Al-Qur'an dalam bahasa Arab serta terjemahannya dalam bahasa Indonesia. Setiap ayat dipetakan dengan terstruktur, sehingga memudahkan pengguna untuk:

  • Menganalisis teks Al-Qur'an menggunakan teknik NLP.
  • Mengembangkan aplikasi seperti sistem tanya-jawab Islami atau analisis semantik.
  • Melatih model penerjemahan otomatis berbasis teks Islami.

Struktur Dataset

  • Kolom:
    • Ayat dalam bahasa Arab.
    • Terjemahan dalam bahasa Indonesia.

Contoh Penggunaan

  1. Analisis Sentimen: Mengidentifikasi emosi atau tema dari ayat-ayat Al-Qur'an.
  2. Sistem Tanya-Jawab: Membuat chatbot Islami yang mampu menjawab pertanyaan pengguna.

2. Dataset Sunnah: Kumpulan Hadis 9 Imam

Deskripsi

Dataset ini berisi teks-teks sunnah (hadis) dari 9 imam terkemuka, meliputi:

  • Imam Bukhari
  • Imam Muslim
  • Imam Abu Dawud
  • Imam Tirmidzi
  • Imam An-Nasa'i
  • Imam Ibnu Majah
  • Imam Ahmad
  • Imam Malik
  • Imam Ad-Darimi

Setiap hadis dilengkapi dengan teks Arab asli dan terjemahan dalam bahasa Indonesia. Dataset ini ideal untuk:

  • Penelitian hadis berbasis NLP.
  • Pembuatan aplikasi pendidikan Islami.
  • Pengembangan sistem klasifikasi hadis berdasarkan perawi atau topik.

Struktur Dataset

  • Kolom:
    • Nama perawi.
    • Teks hadis dalam bahasa Arab.
    • Terjemahan dalam bahasa Indonesia.
  • Ukuran File: 5 MB dalam format CSV.

Contoh Penggunaan

  1. Klasifikasi Hadis: Mengelompokkan hadis berdasarkan tema atau perawi.
  2. Pendidikan Digital: Membuat aplikasi pembelajaran interaktif berbasis sunnah.

Tempat Download Dataset

Anda dapat mengunduh kedua dataset ini melalui platform berikut:

Keduanya tersedia secara gratis untuk keperluan penelitian non-komersial.

Penutup

Saya berharap kedua dataset ini dapat bermanfaat bagi komunitas peneliti, pengembang aplikasi Islami, maupun individu yang ingin mempelajari teks-teks Islami secara mendalam.

Sentry image

Hands-on debugging session: instrument, monitor, and fix

Join Lazar for a hands-on session where you’ll build it, break it, debug it, and fix it. You’ll set up Sentry, track errors, use Session Replay and Tracing, and leverage some good ol’ AI to find and fix issues fast.

RSVP here →

Top comments (0)

The Most Contextual AI Development Assistant

Pieces.app image

Our centralized storage agent works on-device, unifying various developer tools to proactively capture and enrich useful materials, streamline collaboration, and solve complex problems through a contextual understanding of your unique workflow.

👥 Ideal for solo developers, teams, and cross-company projects

Learn more

👋 Kindness is contagious

Please leave a ❤️ or a friendly comment on this post if you found it helpful!

Okay