Definisi, Teknik, Metode, langkah-langkah, Data Mining - Kecerdasan Bisnis
I.
DEFINISI DATA MINING
Data mining adalah suatu
istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam
database.
Data mining merupakan
analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak
diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang
dapat dipahami dan bermanfaat bagi pemilik data.
II.
TEKNIK DATA MINING
Teknik data mining terdiri dari:
1.
Anaisis Cluster
Clustering dan
segmentasi sebenarnya mempartisi database, karena itu setiap partisi atau group
adalah sama menurut kriteria atau metrik tertentu. Jika pengukuran kesamaan
tersedia, maka terdapat sejumlah teknik untuk membentuk cluster.
Kebanyakan aplikasi2
data mining menggunakan clusteing menurut similarity (kesamaan), contohnya
segmentasi basis klien. Clustering menurut optimasi dari sekumpulan
fungsi-fungsi digunakan pada analisis data, misalnya ketika mensetting tarif
asuransi klien dapat disegmentasi menurut sejumlah parameter.
2.
Induksi (Pohon keputusan dan aturan induksi)
Induksi merupakan salah satu teknik inferensi informasi pada database.
Ada dua teknik inferensi yakni :
o
Induksi merupakan teknik inferensi informasi yang digeneralisasi dari
database, contohnya setiap pegawai mempunyai manajer.
o
Deduksi merupakan teknik inferensi informasi dari konsekuensi logis
informasi pada database, contohnya operasi join pada dua tabel; dimana yang
pertama mengenai pegawai dan departemen sedangkan yang kedua mengenai
departemen dan manajer, menghasilkan relasi antara pegawai dan manajer.
3.
Jaringan Syaraf buatan (Neural Network)
Merupakan pendekatan
perhitungan yang melibatkan pengembangan struktur secara matematis dengan
kemampuan untuk ‘belajar’. Jaringan ini menggunakan sekumpulan elemen2
pemrosesan (node) analog pada syaraf otak manusia. Elemen2 pemrosesan ini terhubung dalam
jaringan dimana dapat mengidentifikasikan pola2 dalam data sewaktu
dipertunjukkan pada data, artinya jaringan belajar dari pengalaman seperti
halnya manusia.
4.
Online Analytical Processing (OLAP)
OLAP atau On line
Analytical Processing merupakan salah satu aplikasi database untuk memproses
database yang sangat besar dengan data yang kompleks. Secara singkat bisa
dijawab bahwa teknologi yang ada di data warehouse dan OLAP dimanfaatkan penuh
untuk melakukan data mining.
Contoh
database OLAP misalnya data penjualan yang dikumpulkan dari region, tipe produk
dan cabang penjualan.
5.
Visualisasi data
Visualisasi data memungkinkan penganalis menperoleh pemahaman yang
dalam dan lebih intuitif mengenai data dan dapat bekerja sebaik mungkin pada
data mining.
III.
METODE DATA MINING
Metode yang digunakan dalam data mining:
1.
Algoritma C.4.5
merupakan algoritma
yang digunakan untuk membentuk pohon keputusan. Sedang pohon keputusan dapat
diartikan suatu cara untuk mengklarifikasi yang sangat kuat.
2.
Algoritma K-Means
K-Means merupakan
salah satu metode pengelompokan data non hierarki yang berusaha mempartisi data yang ada ke
dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data kedalam
kelompok sehingga data yang berkarakteristik berbeda dikelompok-kan ke dalam
kelompok yang lain.
3.
Regresi Linier
Analisis regresi
adalah teknik statistik untuk permodelan dan investigasi hubungan dua atau
lebih variabel. Yang sering dipakai adalah regresi linear sederhana. Dalam
analisis regresi satu atau lebih variabel independent / predictor yang biasa
diwakili dengan notasi x dan satu
variabel respon yang biasa diwakili dengan notasi y
IV.
LANGKAH-LANGKAH PEMBUATAN DATA MINING
Langkah-langkah Data mining
1. Identity The Business Problem
Yang pertama dan juga dasar dari virtous cycle adalah mengetahui masalah bisnis yang kita hadapi. Karena kita tidak bisa mengolah data jika kita tidak tau yang sedang kita hadapi. Kita harus mengetahui masalah-masalah apa yang sedang dihadapi. Dengan mengetahui masalah yang dihadapi kita dapat menentukan data-data mana saja yang kita butuhkan untuk dapat dilakukan tahap analisa.
2. Mine The Data For Actionable Information
Setelah mengetajui identifikasi masalah, kita memperolah data-data mana saja yang diperlukan untuk analisa. Barulah kita melakukan analisa terhadap data-data tersebut. Dan dari analisa tersebut analisis akan dapat memperolah sebuah knowledge baru dan baru lah dapat diambil suatu keputusan/kebijaksanaan.
3. Take The Action
Dan dari keputusan/kebijaksanaan yang didapat dari proses data mining itu barulah kita terapkan dengan aksi berupa tindakan-tindakan yang kongkrit/nyata dalam proses bisnis.
4. Measure Results
Setelah diambil tindakan-tindakan dan keputusan, kita memonitori hasil tersebut. Apakah sudah sesuai(memuaskan) dengan target2 yang ingin kita capai, apakah bisa mengatasi masalah-masalah yang dihadapi.
1. Identity The Business Problem
Yang pertama dan juga dasar dari virtous cycle adalah mengetahui masalah bisnis yang kita hadapi. Karena kita tidak bisa mengolah data jika kita tidak tau yang sedang kita hadapi. Kita harus mengetahui masalah-masalah apa yang sedang dihadapi. Dengan mengetahui masalah yang dihadapi kita dapat menentukan data-data mana saja yang kita butuhkan untuk dapat dilakukan tahap analisa.
2. Mine The Data For Actionable Information
Setelah mengetajui identifikasi masalah, kita memperolah data-data mana saja yang diperlukan untuk analisa. Barulah kita melakukan analisa terhadap data-data tersebut. Dan dari analisa tersebut analisis akan dapat memperolah sebuah knowledge baru dan baru lah dapat diambil suatu keputusan/kebijaksanaan.
3. Take The Action
Dan dari keputusan/kebijaksanaan yang didapat dari proses data mining itu barulah kita terapkan dengan aksi berupa tindakan-tindakan yang kongkrit/nyata dalam proses bisnis.
4. Measure Results
Setelah diambil tindakan-tindakan dan keputusan, kita memonitori hasil tersebut. Apakah sudah sesuai(memuaskan) dengan target2 yang ingin kita capai, apakah bisa mengatasi masalah-masalah yang dihadapi.
V.
DECISION TREE
Decision tree merupakan salah satu metode klasifikasi yang menggunakan
representasi struktur pohon (tree) di mana setiap node merepresentasikan
atribut, cabangnya merepresentasikan nilai dari atribut, dan daun
merepresentasikan kelas. Node yang paling atas dari decision tree disebut
sebagai root.
Terdapat 3 jenis node pada
decision tree, yaitu:
1.
Root Node, merupakan node paling atas, pada node ini tidak ada input
dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.
2.
Internal Node , merupakan node percabangan, pada node ini hanya
terdapat satu input dan mempunyai output minimal dua.
3.
Leaf node atau terminal node , merupakan node akhir, pada node ini
hanya terdapat satu input dan tidak mempunyai output.
Referensi:
Komentar
Posting Komentar