Minggu, 28 Oktober 2018

Tugas 5 Big Data

Cika Ramadhanti
1401164033
MB-40-05

Kegunaan dan Contoh Clustering Dalam Data
Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapacluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum.
Kegunaan:
  1. Clustering merupakan metode segmentasi data yang sangat berguna dalam prediksi dan analisa masalah bisnis tertentu. Misalnya Segmentasi pasar, marketing dan pemetaan zonasi wilayah.
  2. Identifikasi obyek dalam bidang berbagai bidang seperti computer vision dan image processing
Contoh:

Tujuan clustering (pengelompokan) data dapat dibedakan menjadi dua, yaitu pengelompokan untuk
pemahaman dan clustering untuk penggunaan (Prasetyo,2012). Biasanya proses pengelompokan untuk
tujuan pemahaman hanya sebagai proses awal untuk kemudian dilanjutkan dengan pekerjaan seperti
summarization(rata-rata,standar deviasi), pelabelan kelas untuk setiap kelompok sehingga dapat
digunakan sebagai data training dalam klasifikasi supervised. Sementara jika untuk penggunaan, tujuan
utama clustering biasanya adalah mencari prototipe kelompok yang paling representatif terhadap data,
memberikan abstraksi dari setiap obyek data dalam kelompok dimana sebuah data terletak didalamnya.

Contoh tujuan clustering untuk pemahaman diantaranya: dibidang Biologi (pengelompokan
berdasarkan karakter tertentu secara hirarkis) , pengelompokan gen yang memiliki fungsi sama.
Dibidang information retrieval (web search),bidang klimatologi (pengelompokam pola tekanan udara
yang berpengaruh pada cuaca),bidang bisnis (pengelompokan konsumen yang berpotensi untuk analisa
dan strategi pemasaran).

Contoh tujuan clustering untuk penggunaan dibidang summarization, dengan semakin besarnya jumlah
data maka ongkos melakukan peringkasan semakin mahal (berat&kompleks), maka perlu diterapkan
pengelompokan data untuk membuat prototipe yang dapat mewakili keseluruhan data yang akan
digunakan. Kompresi , data yang terletak dalam satu cluster dapat dikompresi dengan diwakili oleh
indeks prototipe yang dikaitkan dengan kelompok ,teknik kompresi ini dikenal sebagai quantization
vector.

Sumber:
http://dinus.ac.id/repository/docs/ajar/Clustering.pdf
http://socs.binus.ac.id/2017/03/09/clustering/