Algoritma Dan Metode Data Mining

Data Mining mempunyai beberapa jenis, yaitu ;

1.ESTIMASI

Digunakan untuk melakukan estimasi terhadap sebuah data baru yang tidak memiliki keputusan berdasarkan histori data yang telah ada. Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit).Estimasi nilai dari variable target ditentukan berdasarkan nilai dari variabel prediktor (atribut).Algoritma estimasi yang biasa digunakan adalah ;
Linear Regression, Neural Network, Support Vector Machine.

2.ASOSIASI

Digunakan untuk mengenali kelakuan dari kejadian-kejadian khusus atau proses dimana hubungan asosiasi muncul pada setiap kejadian. Adapun metode pemecahan masalah yang sering digunakan seperti Algoritma Apriori.Dalam dunia bisnis, sering disebut dengan affinity analysis atau market basket analysis.Algoritma asosiasi akan mencari aturan yang menghitung hubungan diantara dua atau lebih atribut.Algoritma association rules berangkat dari pola “If antecedent, then consequent,” bersamaan dengan pengukuran support (coverage) dan confidence (accuration) yang terasosiasi dalam aturan.

3.KLASIFIKASI

Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan. Teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk memberikan sejumlah aturan. Salah satu contoh yang mudah dan popular adalah dengan Decision tree yaitu salah satu metode klasifikasi yang paling populer karena mudah untuk interpretasi seperti Algoritma C4.5, ID3, Naive Bayes, K-Nearest Neighbor, CART, Linear Discriminant Analysis, dll.

4.KLASTERING

Digunakan untuk menganalisis pengelompokkan berbeda terhadap data, mirip dengan klasifikasi, namun pengelompokkan belum didefinisikan sebelum dijalankannya tool data mining. Biasanya menggunkan metode neural network atau statistik, analitikal hierarki cluster.Clustering membagi item menjadi kelompok-kelompok berdasarkan yang ditemukan tool data mining.
Suatu klaster (cluster) adalah koleksi data yang mirip antara satu dengan yang lain, dan memiliki perbedaan bila dibandingkan dengan data dari klaster lain.Perbedaan utama algoritma klastering dengan klasifikasi adalah klastering tidak memiliki target/class/label, jadi termasuk unsupervised learning.Klastering sering digunakan sebagai tahap awal dalam proses data mining, dengan hasil klaster yang terbentuk akan menjadi input dari algoritma berikutnya yang digunakan.


5.PREDIKSI

Algoritma prediksi/forecasting sama dengan algoritma  estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu (data time series).Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan berbagai atribut yang kita sediakan.Semua algoritma estimasi dapat digunakan untuk prediksi/forecasting.




Komentar

Postingan populer dari blog ini

UCI Machine Learning

Data Mining