Definisi, Teknik, Metode, langkah-langkah, Data Mining - Kecerdasan Bisnis


                   
       I.            DEFINISI DATA MINING
Data mining adalah suatu istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database.
Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data.

    II.            TEKNIK DATA MINING
Teknik data mining terdiri dari:
1.      Anaisis Cluster
            Clustering dan segmentasi sebenarnya mempartisi database, karena itu setiap partisi atau group adalah sama menurut kriteria atau metrik tertentu. Jika pengukuran kesamaan tersedia, maka terdapat sejumlah teknik untuk membentuk cluster.
            Kebanyakan aplikasi2 data mining menggunakan clusteing menurut similarity (kesamaan), contohnya segmentasi basis klien. Clustering menurut optimasi dari sekumpulan fungsi-fungsi digunakan pada analisis data, misalnya ketika mensetting tarif asuransi klien dapat disegmentasi menurut sejumlah parameter.

2.      Induksi (Pohon keputusan dan aturan induksi)
Induksi merupakan salah satu teknik inferensi informasi pada database.
Ada dua teknik inferensi yakni :
o   Induksi merupakan teknik inferensi informasi yang digeneralisasi dari database, contohnya setiap pegawai mempunyai manajer.
o   Deduksi merupakan teknik inferensi informasi dari konsekuensi logis informasi pada database, contohnya operasi join pada dua tabel; dimana yang pertama mengenai pegawai dan departemen sedangkan yang kedua mengenai departemen dan manajer, menghasilkan relasi antara pegawai dan manajer.

3.      Jaringan Syaraf buatan (Neural Network)
            Merupakan pendekatan perhitungan yang melibatkan pengembangan struktur secara matematis dengan kemampuan untuk ‘belajar’. Jaringan ini menggunakan sekumpulan elemen2 pemrosesan (node) analog pada syaraf otak manusia.  Elemen2 pemrosesan ini terhubung dalam jaringan dimana dapat mengidentifikasikan pola2 dalam data sewaktu dipertunjukkan pada data, artinya jaringan belajar dari pengalaman seperti halnya manusia.



4.      Online Analytical Processing (OLAP)
            OLAP atau On line Analytical Processing merupakan salah satu aplikasi database untuk memproses database yang sangat besar dengan data yang kompleks. Secara singkat bisa dijawab bahwa teknologi yang ada di data warehouse dan OLAP dimanfaatkan penuh untuk melakukan data mining.
            Contoh database OLAP misalnya data penjualan yang dikumpulkan dari region, tipe produk dan cabang penjualan.

5.      Visualisasi data
Visualisasi data memungkinkan penganalis menperoleh pemahaman yang dalam dan lebih intuitif mengenai data dan dapat bekerja sebaik mungkin pada data mining.
 III.            METODE DATA MINING
Metode yang digunakan dalam data mining:
1.      Algoritma C.4.5
            merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Sedang pohon keputusan dapat diartikan suatu cara untuk mengklarifikasi yang sangat kuat.
2.      Algoritma K-Means
            K-Means merupakan salah satu metode pengelompokan data non hierarki  yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data kedalam kelompok sehingga data yang berkarakteristik berbeda dikelompok-kan ke dalam kelompok yang lain.
3.      Regresi Linier
            Analisis regresi adalah teknik statistik untuk permodelan dan investigasi hubungan dua atau lebih variabel. Yang sering dipakai adalah regresi linear sederhana. Dalam analisis regresi satu atau lebih variabel independent / predictor yang biasa diwakili dengan notasi x dan satu  variabel respon yang biasa diwakili dengan notasi y
 IV.            LANGKAH-LANGKAH PEMBUATAN DATA MINING

Langkah-langkah Data mining
1. Identity The Business Problem
Yang pertama dan juga dasar dari virtous cycle adalah mengetahui masalah bisnis yang kita hadapi. Karena kita tidak bisa mengolah data jika kita tidak tau yang sedang kita hadapi. Kita harus mengetahui masalah-masalah apa yang sedang dihadapi. Dengan mengetahui masalah yang dihadapi kita dapat menentukan data-data mana saja yang kita butuhkan untuk dapat dilakukan tahap analisa.
2. Mine The Data For Actionable Information
Setelah mengetajui identifikasi masalah, kita memperolah data-data mana saja yang diperlukan untuk analisa. Barulah kita melakukan analisa terhadap data-data tersebut. Dan dari analisa tersebut analisis akan dapat memperolah sebuah knowledge baru dan baru lah dapat diambil suatu keputusan/kebijaksanaan.
3. Take The Action
Dan dari keputusan/kebijaksanaan yang didapat dari proses data mining itu barulah kita terapkan dengan aksi berupa tindakan-tindakan yang kongkrit/nyata dalam proses bisnis.
4. Measure Results
Setelah diambil tindakan-tindakan dan keputusan, kita memonitori hasil tersebut. Apakah sudah sesuai(memuaskan) dengan target2 yang ingin kita capai, apakah bisa mengatasi masalah-masalah yang dihadapi.
    V.            DECISION TREE
Decision tree merupakan salah satu metode klasifikasi yang menggunakan representasi struktur pohon (tree) di mana setiap node merepresentasikan atribut, cabangnya merepresentasikan nilai dari atribut, dan daun merepresentasikan kelas. Node yang paling atas dari decision tree disebut sebagai root.
 Terdapat 3 jenis node pada decision tree, yaitu:
1.      Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.
2.      Internal Node , merupakan node percabangan, pada node ini hanya terdapat satu input dan mempunyai output minimal dua.
3.      Leaf node atau terminal node , merupakan node akhir, pada node ini hanya terdapat satu input dan tidak mempunyai output. 









Referensi:






Komentar

Postingan populer dari blog ini

Pengalaman kuliah kerja jadi WAITRESS (Nyambi)

Nyepur Surabaya Malang | Pengalaman naik kereta api KA Penataran

RESUME SISTEM PENDUKUNG KEPUTUSAN - SPK