Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi diperoleh dengan cara mengekstraksi dan mengenali pola data yang terdapat pada basis data. Buku ini berisi tentang konsep dasar, penerapan metode data mining, dan cara pengolahan dengan aplikasi rapidminer.
Buku ini terdiri dari tujuh bab, yaitu :
Bab 1 Konsep Dasar Data Mining terdiri dari preprocessing data, teknik pembelajaran data mining, transformasi data, penerapan data mining.
Bab 2 Teknik Klasifikasi Decision Tree terdiri dari pengertian, manfaat, kelebihan, kekurangan, model decision tree, algoritma ID3 contoh alur penerapan, algoritma C4.5 contoh alur penerapan, dan perbedaan algoritma ID3 dan C4.5.
Bab 3 Teknik Klasifikasi Teorema Bayes terdiri dari algoritma Naïve Bayes, Algoritma Find-S.
Bab 4 Teknik Klasifikasi Analisa Diskriminan terdiri dari uji kenormalan peubah ganda, uji kesamaan matriks ragam, uji vector nilai rataan, dan penentuan peubah bebas dalam pembentukan fungsi diskriman dengan prosedur stepwise.
Bab 5 Teknik Klaster K-Means terdiri dari algoritma K-Means dan penerapan contoh yang mengacu pada beberapa paper referensi.
Bab 6 Analisis Asosiasi terdiri dari algoritma apriori dan penerapan contoh yang mengacu pada beberapa paper referensi.
Bab 7 Data Mining Tool terdiri dari alur penyelesaian algoritma K-Means, Apriori, ID3, C4.5, K-Medoid dengan menggunakan Rapidminer.
Setiap metode pada buku ini dibahas dengan contoh penghitungan langkah demi langkah dan disertai dengan beberapa kasus yang berhubungan dengan pengambilan keputusan.
Source Code Aplikasi Data Mining dengan Algoritma C4.5
Sarjana Komedi Juli 6, 2017 Aplikasi Web, Freebies, Source Code 20,456 Views
Source Code Aplikasi Data Mining dengan Algoritma C4.5 – Algoritma C4.5 merupakan algoritma yang digunakan untuk melakukan pembentukan pohon keputusan. Pohon keputusan tersebut mampu menghasilkan keputusan kompleks menjadi lebih sederhana.
Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut :
- Pilih atribut sebagai akar.
- Buat cabang untuk tiap-tiap nilai.
- Bagi kasus dalam cabang.
- Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama.
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus :
Setelah mendapatkan nilai gain, terdapat satu hal lagi yang perlu dilakukan perhitungan yaitu mencari nilai entropy. Entropy digunakan untuk menentukan seberapa informative sebuah input atribut untuk menghasilkan output atribut.
Seperti itulah dasar teori mengenai algoritma c4.5 yang digunakan untuk membuat source code aplikasi data mining dengan menggunakan algoritma c4.5. Aplikasi yang dibuat kali ini adalah sebuah aplikasi yang digunakan untuk memprediksi penjualan dengan menggunakan algoritma c4.5 tentunya.
Contoh aplikasi yang sangat simpel dan sederhana ini dibuat menggunakan bahasa pemrograman PHP dan masih menggunakan ekstensi MySQL dalam interkoneksi dengan databasenya hal ini tentu membuat aplikasi ini tidak dapat berjalan di sistem dengan PHP versi terbaru. Kenapa masih menggunakan ekstensi MySQL? tentunya karena memang aplikasi ini dibuat pada tahun 2009.
Jadi untuk menjalankan source code aplikasi data mining dengan menggunakan algoritma c4.5 dalam menentukan atau memprediksi penjualan ini kalian disarankan menggunakan web server atau xampp versi 1.7.3 atau web server dengan PHP versi tidak lebih dari 5.4.12.
Source code data mining dalam Aturan Asosisasi atau Association Rule dengan menggunakan metode Apriori yaitu Algoritma Apriori termasuk dalam jenis aturan asosiasi pada data mining. Selain apriori, banyak yang termasuk pada golongan ini adalah metode generalized rule induction dan algoritma hash based. dengan Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis atau market basket analysis. Analisis dengan asosiasi atau association with rule mining adalah sebuah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item yang berkaitan. Sebagai contoh aturan assosiatif dari analisa pembelian di suatu supermarket atau tempat perbelanjaan adalah dapat diketahuinya berapa besar kemungkinan atau peluang seorang pelanggan membeli sebuah sikat gigi bersamaan dengan membeli pasta gigi. Dengan pengetahuan tersebut pemilik supermarket atau tempat perbelanjaan dapat mengatur penempatan barang-barangnya atau merancang strategi pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.