UCI Machine Learning
Cara Mencari DataSet Pada UCI Machine Learning
TAHAP 1 :
Kemudian akan muncul tampilan seperti di bawah ini :
Uci Machine Learning Repository adalah kumpulan
basis data, teori domain, dan generator data yang digunakan oleh komunitas
pembelajaran mesin untuk analisis empiris algoritma pembelajaran mesin. Dibuat
sebagai arsip ftp pada tahun 1987 oleh David Aha dan sesama mahasiswa
pascasarjana di UC Irvine.
TAHAP 2 :
Klik “VIEW ALL DataSets” pada pojok kanan
atas.Seperti gambar di bawah ini :
TAHAP 3 :
Pilih Data yang ingin dianalisis, disini saya memilih Data tentang "Car Evaluation DataSet"
TAHAP 4 :
Pada gambar di bawah, terdapat tabel yang menjelaskan tentang:
- Jenis DataSet,yaitu Multivariate.
Analisis statistik
multivariate merupakan metode statistik yang memungkinkan kita melakukan penelitian
terhadap lebih dari dua variable secara bersamaan. Dengan menggunakan teknik analisis
ini maka kita dapat menganalisis pengaruh beberapa variable terhadap variabel –
(variable) lainnya dalam waktu yang bersamaan.Contohnya pada dataset yang saya ambil.
Analisis multivariate digunakan karena pada
kenyataannnya masalah yang terjadi tidak dapat diselesaikan dengan hanya
menghubung-hubungkan dua variable atau melihat pengaruh satu variable terhadap
variable lainnya.
- Jenis Atribut Data,yaitu Nominal
Nominal berarti
"yang berkaitan dengan nama-nama." Nilai-nilai atribut nominal adalah
simbol atau nama-nama dari suatu benda. Setiap nilai merupakan semacam
kategori, kode, atau status dan sebagainya sehingga atribut nominal juga
disebut sebagai kategorikal. Nilai-nilai di dalamnya tidak memiliki urutan.
Dalam ilmu komputer, nilai-nilai tersebut disebut juga dengan enumerasi.
- Jenis Karakteristik, yaitu Clasification
Clasification merupakan
suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau
konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang
penting serta dapat meramalkan kecenderungan data pada masa depan.
Pencipta:
Marko Bohanec
Donatur:
1. Marko Bohanec
(marko.bohanec '@' ijs.si)
2. Blaz Zupan
(blaz.zupan '@' ijs.si)
Informasi Kumpulan
Data:
Database Evaluasi Mobil
berasal dari model keputusan hierarkis sederhana yang awalnya dikembangkan
untuk demonstrasi DEX, M. Bohanec, V. Rajkovic: Sistem pakar untuk pengambilan
keputusan. Sistemica 1 (1), hlm. 145-157, 1990.). Model mengevaluasi mobil
sesuai dengan struktur konsep berikut:
Penerimaan mobil CAR
. HARGA harga
keseluruhan
. . beli harga beli
. . mempertahankan
harga perawatan
. Karakteristik teknis
TECH
. . Kenyamanan NYAMAN
. . . pintu-pintu
sejumlah pintu
. . . kapasitas orang
dalam hal orang untuk dibawa
. . . lug_boot ukuran
boot bagasi
. . keselamatan
diperkirakan keselamatan mobil
Atribut input dicetak
dalam huruf kecil. Selain konsep target (CAR), model ini mencakup tiga konsep
perantara: PRICE, TECH, COMFORT. Setiap konsep ada dalam model asli yang
terkait dengan keturunan tingkat bawah oleh serangkaian contoh (untuk
contoh-contoh ini lihat [Tautan Web]).Basis Data Evaluasi
Mobil berisi contoh-contoh dengan informasi struktural dihapus, mis., Secara
langsung menghubungkan CAR dengan enam atribut input: membeli, memelihara,
pintu, orang, lug_boot, keselamatan.Karena struktur konsep
dasar yang diketahui, basis data ini mungkin sangat berguna untuk menguji
induksi konstruktif dan metode penemuan struktur.
TAHAP 5:
Untuk menganalisis dataset, klik link DataFolder seperti gambar di bawah ini:
Kemudian download file dengan ekstensi .data dan .names yang ada di dalamnya.
TAHAP 6:
Buka lokasi file yang telah di download, kemudian klik kanan pada ekstensi .data dan rename file tersebut dan ganti ekstensinya menjadi .csv.
Buka dengan file excel,maka tampilannya akan seperti di bawah ini.
TAHAP 7:
Untuk melihat deskripsi dari dataset tersebut, dapat dilihat pada file dengan ekstensi .names
Informasi Atribut:
Atribut:
buying: vhigh, tinggi,
med, rendah.
Maint: vhigh, tinggi,
med, rendah.
doors: 2, 3, 4, 5 lagi.
person: 2, 4, lebih
banyak.
lug_boot: kecil, med,
besar.
safety: rendah, med,
tinggi.








Komentar
Posting Komentar