Data Mining merupakan suatu
proses pencarian atau ekstraksi pola yang menarik dari data dalam jumlah yang
relatif besar . Suatu pola dikatakan menarik apabila pola tersebut tidak
sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan
haruslah mudah dimengerti, berlaku untuk data yang akan diprediksi dengan
derajat kepastian tertentu, berguna, dan yang pasti baru.
Data Mining memang salah
satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan
untuk menempatkan data mining di bidang ilmu mana, karena data mining
menyangkut database, kecerdasan buatan (artificial intelligence), statistik,
dsb.
Beberapa pihak menyampaikan
bahwa data mining tidak lebih dari machine learning atau analisa statistik yang
berjalan di atas database. Tapi hal ini dibantah oleh pihak lain yang mempunyai
pemikiran bahwa database berperanan penting di data mining karena data mining
mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran
penting database terutama dalam optimisasi query-nya.
Data mining sering pula
disebut Knowledge Discovery in Database. Adapula yang menyebutkan sebagai
analisis pola atau arkeologi data. Bahkan ada yang menyebutnya sebagai intelegensia
bisnis. Data Mining, atau dalam bahasa Indonesia kita sebut sebagai penggalian
data, diperlukan saat data yang tersedia sangat / terlalu banyak (misalnya data
yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan
data bioinformatika), tetapi tidak tahu pola apa yang bisa didapatkan.
Data mining tidak hanya
melakukan mining terhadap data transaksi saja. Penelitian di bidang data mining
saat ini sudah merambah ke sistem database lanjut seperti object oriented
database, image/spatial database, time-series data/temporal database, teks
(dikenal dengan nama text mining), web (dikenal dengan nama web mining) dan
multimedia database.
Penggalian data adalah
salah satu bagian dari proses pencarian pola. Berikut ini urutan proses
pencarian pola :
- Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
- Integrasi Data: yaitu menggabungkan berbagai sumber data.
- Pemilihan Data: yaitu memilih data yang relevan.
- Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.
- Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
- Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.
- Penyajian pola: yaitu memvisualisasi pola ke pengguna.
Sumber :
https://id.wikipedia.org/wiki/Penggalian_data
www.ilmukomputer.com (Data Mining by Yudho)
No comments:
Post a Comment
Silakan berkomentar ....