DATA MINING
Pengertian:
Serangkaianprosesuntukmenggalinilaitambahdarisuatukumpulandata berupapengetahuanyang selamainitidakdiketahuisecaramanual darisuatukumpulandata
Suatuprosesyang menggunakanberbagaiperangkatlunakanalisisdata untukmenemukanpoladanrelasidata agar dapatdigunakanuntukmembuatprediksidengantepat
Suatuprosesmencaripolaatauinformasimenarikdalamdata terpilihdenganmenggunakanteknikataumetodetertentu
KEBUTUHAN DATA MINING
Data mining dibutuhkandalam:
Penanganantipe-tipedata yang berbeda
Efisiensidanskalabilitasdarialgoritmadata mining
Kegunaan, kepastiandanekspresidarihasil-hasildata mining
Ekspresidariberbagaijenishasildata mining
Proteksidariprivacy dankeamanandata
Interaktifpenggalianpengetahuanpadalevel abstraksimultipel
Penggalianinformasidarisumberdata yang berbeda
PENERAPAN DATA MINING
Penerapandata mining dalamberbagaibidang, antaralain :
Analisapasardanmanajemen
AnalisaPerusahaandanManajemenResiko
Telekomunikasi
Keuangan
Asuransi
AnalisaPasardanManajemen
–Menebaktarget pasar
–Melihatpolabelipemakaidariwaktukewaktu
–Cross Market Analysis
–ProfilCustomer
–IdentifikasiKebutuhanCustomer
–Menilailoyalitascustomer
–Informasisummary
Analisa Perusahaan dan Manajemen Resiko–Merencanakan Keuangan dan Evaluasi Aset–Merencanakan Sumber Daya (Resource Planning)–Memonitor Persaingan (Competition)
Telekomunikasi
Data mining digunakanuntukmelihatjutaantransaksiyang masukdengantujuanmenambahlayananotomatis
KeuanganData mining digunakan untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan dimana akan susah dilakukan jika menggunakan analisis standar. AsuransiData mining digunakan untuk mengidentifikasi layanan kesehatan
TEKNIK DATA MINING
TigaTeknikData Mining yang Populer:
Association Rule Mining
Classification
Clustering
ASSOCIATION RULE MINING
Untukmenemukanaturanassosiatifantarasuatukombinasiitem.
Terdapat duaparameter:
Supportyaitupersentasekombinasiitem tersebutdalamdatabase
Confidenceyaitukuatnyahubunganantaritem dalamaturanassosiatif.
CLASSIFICATION
Prosesuntukmenemukanmodel ataufungsiyang menjelaskanataumembedakankonsepataukelasdata dengantujuanuntukdapatmemperkirakankelasdarisuatuobjekyang labelnyatidakdiketahui.
Model itusendiribisaberupaaturanjika-maka, decissiontree, formula matematisatauneural network
Prosesclassification terdiridarifaselearning danfasetest
CLUSTERING
Untukmemaksimalkankesamaanantaranggotasatukelasdanmeminimalkan kesamaan antarkelas/cluster.
Clustering mengelompokkandata tanpaberdasarkankelasdata tertentu. Bahkanclustering dapatdipakaiuntukmemberikanlabel padakelasdata yang belumdiketahuiitusehinggadisebutunsupervised learning.
Clustering dapatdilakukanpadadata yang memilikibeberapaatributyang dipetakansebagairuangmultidimensi.
Tidak ada komentar:
Posting Komentar