Skip to content
Inovatif, Profesional dan Berkepribadian
facebook
youtube
instagram
EnglishIndonesian
Ilmu Komunikasi-Program studi terbaik di Sumatera Utara
Help Desk 081269419190
Email Support isipol@uma.ac.id
Location Jl. Kolam No. 1 Medan Estate
  • BERANDA
  • PROFIL
    • AKREDITASI
    • Fungsionaris
    • Struktur Organisasi
    • Visi & Misi
    • KERJASAMA
  • AKADEMIK
    • INFORMASI AKADEMIK
      • AKADEMIK ONLINE
      • E-LEARNING
      • Jurnal
      • Lapor AOC
      • Dosen Penasehat Akademik
    • JADWAL AKADEMIK
      • Jadwal Kuliah
      • JADWAL PRAKTIKUM
      • Jadwal Seminar Dan Sidang
      • Jadwal UTS
      • Jadwal UAS
      • Jadwal Semester Antara
      • Jadwal Wisuda
    • KALENDER AKADEMIK
    • Kurikulum
      • SEMESTER I
      • SEMESTER II
      • SEMESTER III
      • SEMESTER IV
      • SEMESTER V
      • SEMESTER VI
      • SEMESTER VII
      • SEMESTER VIII
  • AKTIVITAS PRODI
    • KEGIATAN PRODI
    • PRESTASI PRODI
  • MAHASISWA
    • BEASISWA
      • Beasiswa KIP – Kuliah
      • Beasiswa Bank Indonesia (BI)
      • Beasiswa UKT/SPP Mahasiwa
      • Beasiswa Peningkatan Prestasi Akademik (PPA)
      • Beasiswa YPHAS (Rangking SLTA/Sederajat)
      • Beasiswa YPHAS (Bersaudara Kandung & Anak Dosen / Karyawan)
    • SISTEM INFORMASI
      • Data Mahasiswa
      • Blog Mahasiswa
      • Jurnal Mahasiswa
      • AOC
      • E-Learning
      • APIK
      • Kuota
      • OPAC
      • WEBMAIL
      • SiProdi
    • Prestasi Mahasiswa
  • DOSEN
    • Dosen Prodi
    • Blog Dosen
    • Aktivitas Dosen
    • Prestasi Dosen
    • Jurnal Dosen
    • AOC
    • RKTS
    • RPS
    • TKTD
    • E-Learning
    • OPAC UMA
    • WEBMAIL
  • ARSIP
    • Dokumen Prodi
    • Pengumuman
  • ALUMNI
    • TRACER STUDY
    • DATA ALUMNI
    • LAYANAN ALUMNI
  • LABORATORIUM
    • infomasi Laboratorium
    • Aplikasi Laboratorium
  • HUBUNGI KAMI

Perbedaan konsep text mining dan data mining (definisi, penerapan dan contoh algoritma yang dipakai)

Home > Artikel > Perbedaan konsep text mining dan data mining (definisi, penerapan dan contoh algoritma yang dipakai)

Perbedaan konsep text mining dan data mining (definisi, penerapan dan contoh algoritma yang dipakai)

Posted on January 2, 2023January 4, 2023 by fisipol
0

Perbedaan konsep text mining – Text mining adalah proses mendeteksi informasi atau sesuatu yang baru dan meneliti informasi besar. Text mining menganalisis text yang tidak terstruktur yang terkait satu sama lain dan yang berhubungan dengan prinsip dan aturan lain. Hasil yang diharapkan adalah pemahaman baru yang yang tidak diketahui dan belum jelas sebelumnya. Text mining berisikan tentang sejumlah sub-task, information retrieval, categorization, POS tagging, Clustering, dan lainnya, yang bisa dikatergorikan didalam framework Knowledge Discovery in Databases yang tidak lain adalah metode menerangkan pattern di bagian dalam keterangan yang benar, unik, dan dimengerti. Knowledge Discovery and Data Mining adalah proses yang dibantu oleh komputer untuk menggali dan menganalisis sejumlah besar himpunan data dan mengekstrak informasi dan pengetahuan yang berguna.

Perbedaan konsep text mining – Data Mining adalah suatu proses mencari dan mengumpulkan data yang bermanfaat dari suatu kumpulan data yang besar. Data Mining lebih dekat pada bidang pencarian pengetahuan dalam basis data (knowledge discovery in database / KDD), yang merupakan proses konversi dari data mentah menjadi informasi yang bermanfaat.

Proses:

Proses text mining bertujuan untuk memproses data tidak terstruktur untuk mengekstrak pola yang berarti dan dapat ditindaklanjuti untuk pengambilan keputusan yang lebih baik.

Step 1, Membangun Corpus, Tujuan utama dari kegiatan tugas pertama adalah mengumpulkan semua dokumen yang terkait dengan konteks yang sedang dipelajari.

Step 2, Membuat Term–Document Matrix. Dalam tugas ini, dokumen digital dan terorganisir (korpus) digunakan untuk membuat file term – document matrix (TDM)

Step 3, Mengekstrak Pengetahuan, Menggunakan TDM yang terstruktur dengan baik, dan berpotensi ditambah dengan elemen data terstruktur lainnya, pola baru diekstraksi dalam konteks masalah spesifik yang sedang ditangani.

Untuk melaksanakan proses data mining secara sistematis, proses umum biasanya diikuti berdasarkan praktik terbaik, peneliti dan praktisi data mining telah mengusulkan beberapa proses untuk memaksimalkan peluang keberhasilan dalam melakukan proyek data mining.

Step 1, untuk pemahaman bisnis diperlukan orang yang bertanggung jawab untuk mengumpulkan data, menganalisis data, dan melaporkan temuan. Pada tahap awal ini, anggaran untuk mendukung studi juga harus didirikan, setidaknya pada tingkat tinggi dengan angka kasar.

Step 2, pemahaman data, data mining dikhususkan untuk menangani tugas bisnis yang terdefinisi dengan baik, dan berbeda tugas bisnis membutuhkan kumpulan data yang berbeda. Mengikuti pemahaman bisnis, file Kegiatan utama dari proses data mining adalah untuk mengidentifikasi data yang relevan dari banyak yang tersedia database. Beberapa poin penting harus dipertimbangkan dalam identifikasi dan pemilihan data tahap. Pertama dan terpenting, analis harus jelas dan ringkas tentang deskripsi tugas penambangan data sehingga data yang paling relevan dapat diidentifikasi.

Step 3, persiapan data, Tujuan dari persiapan data (lebih sering disebut data preprocessing) adalah untuk mengambilnya data yang diidentifikasi pada langkah sebelumnya dan mempersiapkannya untuk dianalisis dengan metode data mining.

Step 4, pembuatan model, teknik pemodelan dipilih dan diterapkan pada yang sudah disiapkan kumpulan data untuk memenuhi kebutuhan bisnis tertentu. Langkah pembangunan model juga mencakup penilaian dan analisis komparatif dari berbagai model yang dibangun. Karena tidak ada metode atau algoritma terbaik yang dikenal secara universal untuk tugas data mining, seseorang harus menggunakan file berbagai jenis model yang layak bersama dengan eksperimen dan penilaian yang terdefinisi dengan baik strategi untuk mengidentifikasi metode “terbaik” untuk tujuan tertentu.

Algoritma yang dipakai:

Algoritma yang dipakai pada data mining Prediction: Decision Trees, Linear/Nonlinear Regression, Autoregressive Methods Association: Apriori, Expectation Maximization, Graph- Based Matching Segmentation: k-means, Expectation Maximization.

Algoritma yang dipakai pada text mining Algoritma stoplist, Algoritma Nazief dan Adriani, Algoritma Arifin & Setiono, Algoritma Vega, Algoritma Rabin-Karp.

 

Baca Artikel Berikutnya :
Mengenal Teknik Feynman untuk Metode Belajar

Post Views: 109

PIMPINAN PROGRAM STUDI


Dekan Fakultas ISIPOL
Dr. Effiati Juliana Hasibuan, M.Si



Wakil Dekan Bidang Pendidikan, Penelitian dan Pengabdian kepada Masyarakat
Dr. Nadra Ideyani Vita, M.Si



Wakil Dekan Bidang Inovasi, Kemahasiswaan dan Alumni
Dr. Dedi Sahputra, MA



Ketua Program Studi Ilmu Komunikasi
Agnita Yolanda, B.Comm, M.Sc



Sekretaris Program Studi Ilmu Komunikasi
Angga Tinova Yudha, M.I.Kom


INFO AKADEMIK

KAITAN UMA

Peta Lokasi

KAMPUS I
Jalan Kolam Nomor 1 Medan Estate / Jalan Gedung PBSI, Medan 20223
(061) 7360168, 7366878, 7364348. Call Canter : 0811-6013-888
(061) 7368012
univ_medanarea@uma.ac.id
KAMPUS II
Jalan Sei Serayu Nomor 70 A / Jalan Setia Budi Nomor 79 B, Medan 20112
(061) 8225602, 8201994 HP : 0811 607 259
(061) 8226331
isipol@uma.ac.id

STATISTIK PENGUNJUNG WEB

  • 6
  • 8,873
  • 1,863
  • 84,202
  • 3,299,223
  • 1,491,736
Copyright 2023 © by PDAI Universitas Medan Area
↑
↓