Data Mining
Data
Mining menurut beberapa ahli :
Menurut Pramudiono:
Data Mining adalah
analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan
untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak
disadari keberadaanya. (Pramudiono,2006)
Menurut Larose:
Data Mining merupakan
analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak
diduga dan meringkasdata dengan cara berbeda dengan cara yang berbeda dengan
sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data. (Larose,
2005)
Data Mining merupakan
bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran
mesin, pengenalan pola, statistic,database, dan visualisasi untuk penanganan
permasalahan pengambilan informasi dari database yang besar.(Larose, 2005)
Mengapa kita perlu
memahami Data Mining? Karena manusia menghasilkan banyak sekali Data yang
sangat besar baik dalam bidang Bisnis, Kedokteran, Cuaca, Olahraga, Politik dan
sebagainya.
Kita mengetahui bahwa setiap proses terdiri dari
3 (tiga) fase yaitu :
INPUT -> PROSES -> OUTPUT
Dari gambar di atas
bahwa mengetahui suatu hal itu dapat diselesaikan dimulai dengan sebuah Inputan
(data) kemudian di Proses sehingga menghasilkan sebuah keluaran. Tentunya di
dalam data mining juga mengalami fase tersebut. Yangmembedakannya adalah pada
Data Mining yang menjadi Input adalah Himpunan Data, Prosesnya adalah Algoritma
atau metode dalam Data Mining itu sendiri, dan Keluarannya adalah berupa
Pengetahuan dalam bentuk Pola, Decision Tree, Cluster dan lain-lain.Untuk lebih
jelasnya dapat dilihat dari penjelasan di bawah ini :
1. Gold Mining
Gambar Tersebut diatas
menjelaskan tentang beberapa orang
sedang mencari dan melakukan penambangan emas. Jadi dalam hal ini yang
menjadi Input adalah Bukit Emas sedangkan proses yang K adalah Penambangan yang
dimulai dengan Identifikasi titik pada Bukit Emas tersebut dimana Emas itu
berada dan dilanjutkan dengan proses Penggalian sampai mendapatkan Emas sebagai
Outputnya.
2. Data Mining
Gambar tersebut di atas
menjeleskan sebuah Himpunan Data yang menjadi Input kemudian dilakukan pencarian
pengetahuan menggunakan Metode Data Mining sehingga pada akhirnya didapatkan Pengetahuan
sebagai Output.
Berdasarkan proses di
atas untuk menunjang pemahaman tentang Data Mining kita harus memahami beberapa
disiplin ilmu lain seperti terlihat pada penjelasan di bawah ini:
1.Knowledge Discovery
Database(KDD)
Pada proses Data Mining
yang biasa disebut Knowledge Discovery Database(KDD) terdapat beberapa proses
seperti terlihat pada gambar di bawah ini:
Penjelasan gambar:
Pada proses Knowledge
Discovery Database (KDD)terdapat beberapa fase yaitu sebagai berikut:
Pada proses Knowledge
Discovery Database (KDD)terdapat beberapa fase yaitu sebagai
berikut:
1. Seleksi Data
(Selection)
Selection
(seleksi/pemilihan) data dari merupakan sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam Knowledge Discovery Database
(KDD) dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining,
disimpan dalam suatu berkas, terpisah dari basis data operasional
2. Pemilihan Data
(Preprocessing/Cleaning) Proses Preprocessingmencakup antara lain membuang
duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada
data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment,
yaitu proses “memperkaya” data yang
sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk
KDD, seperti data atau informasi eksternal.
3. Transformasi
(Transformation).Pada fase ini yang dilakukan adalah mentransformasi bentuk
data yang belum memiliki entitas yang jelas kedalam bentuk data yang valid atau
siap untuk dilakukan proses Data Mining.
4. Data Mining
Pada fase ini yang
dilakukan adalah menerapkan algoritma atau metode pencarian pengetahuan.
5. Interpretasi/Evaluasi
(Interpratation/Evaluation)
Pada fase terakhir ini
yang dilakukan adalah proses pembentukan keluaran yang mudah dimengerti yang
bersumber pada proses Data Mining Pola informasi.
Komentar
Posting Komentar