Tugas Cluster Analysis Menggunakan SPSS
On Monday, February 20, 2017
1. Pendahuluan
Data yang diambil
ini adalah data harga bahan bakar gas per kWH (Rp/kWh) untuk PLTGU pada Bulan Agustus 2016 yang meliputi 6 buah Gas Turbine (GT) yaitu GT 1.1;
GT 1.2; GT 1.3; GT 2.1; GT 2.2; GT 2.3. Data dibawah ini tersaji dari hari ke -
1 sampai hari ke – 30 dan akan dikelompokkan pada hari ke berapa yang memiliki rata – rata kedekatan konsumsi bahan bakar dalam Rp/kWh
sehingga bisa digunakan untuk memberi kesimpulan rata – rata hari dimana ke – 6 Gas Turbine
memiliki biaya yang hampir sama dan terendah untuk menentukan pola operasi yang
tepat agar target penghematan bisa tercapai. Dengan kata lain analisa ini
digunakan untuk mennetukan pola operasi yang menghasilkan revenue paling
optimal ditinjau dari biaya Rp/kWh - nya.
2. Deskripsi Data
- Tampilan di Data View menggunakan SPSS
- Tampilan di Variable View
Data
diatas adalah harga bahan bakar per kWh (Rp/KwH) dari PLTGU Bulan
Agustus 2016 dari hari ke – 1 sampai hari ke – 30 dalam rata – rata yang
didapatkan dari tim bahan bakar unit pembangkitan. Sebagai contoh pembacaan pada hari
ke – 1 yaitu GT 1.1 sebesar 254.78 yang berarti Gas Turbine Unit 1.1
menghabiskan bahan bakar sebesar Rp 254.78 / kWh untuk menghasilkan daya per
jam sebesar 1 kW.
3. Analisis Data
Hasil Output SPSS :
- Descriptive Statistic
Analisa
diatas adalah untuk menstandarisasi data meskipun satuan antar variabel sudah sama namun untuk
pembelajaran kami tampilkan. Data
yang digunakan terdiri dari 30 observasi yang kemudian dilakukan analisis
secara statistika deskriptif. Nilai minimum, maksimum, mean, standar deviation dan variance ditampilkan
per variabel data.
Case
Processing Summarya
|
|||||
Cases
|
|||||
Valid
|
Missing
|
Total
|
|||
N
|
Percent
|
N
|
Percent
|
N
|
Percent
|
30
|
100,0%
|
0
|
0,0%
|
30
|
100,0%
|
a.
Euclidean Distance used
|
Analisa dari tabel adalah jumlah data sebanyak 30 buah
telah diproses tanpa ada data yang hilang. Karena tidak
diketahui adanya pembagian kelompok yang khusus (unsupervised) maka digunakan hierarchial
clustering.
Berdasarkan
nilai yang dihasilkan dari tabel descriptive
statistics didapatkan beberapa informasi yang dapat diketahui. Nilai
rata-rata harga bahan bakar gas dari ke enam turbin. Nilai rata-rata yang
dihasilkan dari keenam turbin memiliki nilai dalam selang 248 hingga 262 dengan
nilai yang cukup bervariasi untuk tiap turbinnya. Berdasarkan nilai rata-rata
harga bahan bakar dari tiap turbin diketahui nilai rata-ratanya memiliki
perbedaan satu sama lain. Nilai rata-rata harga pada Turbin GT_1.2 memiliki
nilai paling kecil sehingga dapat dikatakan bahwa Turbin tersebut merupakan
turbin yang lebih baik dari yana glain karena membutuhkan biaya untuk bahan
bakar yang lebih murah. Sedangkan rata-rata haraga bahan bakar paling mahal
terdapat pada turbin GT_2.2 yang mencapai Rp 262/kWh. Harga bahan bakar
terendah selama 30 hari berada pada turbin GT_2.1 yang membutuhkan Rp
216.60/kWh.
Untuk
mengetahui apakah biaya tiap turbin berbeda dapat menggunakan ANOVA. Berikut
merupakan hasil yang didapatkan.
Source DF SS
MS F P
Jenis_Turbin 5
3942 788 2.51
0.032
Error 174 54580
314
Total 179 58522
|
Dari
hasil diatas dapat diketahui bahwa minimal satu turbin yang memiliki biaya yang
berbeda dengan turbin lain. Hal itu dapat diliaht dari nilai p-value yang
dihasilkan kurang dari alfa (0,05). Untuk melihat turbin yang berbeda dapat
dilihat dalam tabel berikut.
Jenis_Turbin N
Mean Grouping
5 30 262.11
A
6 30 257.90
A B
4 30 252.48
A B
1 30 252.46
A B
3 30 250.28
A B
2 30 248.36
B
|
Dari
Tabel diatas dapat dilihat bahwa kelompok yang terbentuk sebanyak dua dimana
nilai dari turbin ke 5 (GT_2.2) berbeda dengan turbin ke 2 (GT_1.2). hal
tersebut diketahui karena turbin 2 dan 5 masuk kedalam kelompok yang berbeda
sehingga dapat dikatakan bahwa nilai rata-rata dari biaya bahan bakar yang
mereka butuhkan berbeda satu sama lain.
Dalam
kasus ini ingin dilakukan pengelompokkan hari yang memiliki tingkat kemiripan
yang sama. Hal tersebut dilihat berdasarkan jarak Euclidian menggunakan metode hierarcial
clustering. Clustering digunakan
untuk mengelompokkan hari yang memiliki harga bahan bakar dari keenam turbin
yang mirip. Jumlah cluster yang
digunakan adalah 2,3,4 dimana dibagi dalam kelompok (Tinggi, Rendah), (Tinggi,
Sedang, Rendah) dan (Tinggi, Cukup Tinggi, Sedang, Rendah).
Cluster
Membership
Case
|
4 Clusters
|
3 Clusters
|
2 Clusters
|
1:Case 1
|
1
|
1
|
1
|
2:Case 2
|
1
|
1
|
1
|
3:Case 3
|
1
|
1
|
1
|
4:Case 4
|
1
|
1
|
1
|
5:Case 5
|
2
|
2
|
1
|
6:Case 6
|
2
|
2
|
1
|
7:Case 7
|
2
|
2
|
1
|
8:Case 8
|
1
|
1
|
1
|
9:Case 9
|
1
|
1
|
1
|
10:Case 10
|
1
|
1
|
1
|
11:Case 11
|
3
|
3
|
2
|
12:Case 12
|
3
|
3
|
2
|
13:Case 13
|
3
|
3
|
2
|
14:Case 14
|
3
|
3
|
2
|
15:Case 15
|
3
|
3
|
2
|
Case
|
4 Clusters
|
3 Clusters
|
2 Clusters
|
16:Case 16
|
4
|
3
|
2
|
17:Case 17
|
3
|
3
|
2
|
18:Case 18
|
3
|
3
|
2
|
19:Case 19
|
3
|
3
|
2
|
20:Case 20
|
2
|
2
|
1
|
21:Case 21
|
2
|
2
|
1
|
22:Case 22
|
1
|
1
|
1
|
23:Case 23
|
2
|
2
|
1
|
24:Case 24
|
1
|
1
|
1
|
25:Case 25
|
1
|
1
|
1
|
26:Case 26
|
1
|
1
|
1
|
27:Case 27
|
1
|
1
|
1
|
28:Case 28
|
2
|
2
|
1
|
29:Case 29
|
2
|
2
|
1
|
30:Case 30
|
1
|
1
|
1
|
Tabel
diatas merupakan Cluster Membership yang menyatakan hasil pengelompokkannya
berdasarkan jarak Euclidian-nya.
Nilai yang terdapat dalam kolom merupakan hasil observasi atau hari ke-i
tergolong dalam cluster berapa. Contohnya, pada case 1 (hari 1) tergolongkan
dalam cluster 1, sedangkan case 5 (hari ke 5) tergolong dalam cluster dua dan
seterusnya untuk semua cluster. Agar lebih mudah dalam visualisasi maka dapat
dilihat dalam gambar berikut.
Gambar diatas
merupakan dendogram yang menyatakan observasi dalam kelompok-kelompok.
Dendogram juga bisa dikatakan bentuk visual dari tabel cluster membership. Untuk
mengetahui seberapa besar pengaruh cluster yang terbentuk dapat melihat dari
dendogram diatas. Seberapa besar pengaruh cluster dapat digunakan untuk memilih
berapa jumlah pembagian cluster yang lebih cocok digunkan. Jadi dari ketiga
pilihan jumlah cluster yang digunakan (2 cluster, 3 cluster dan 4 cluster)
sebaiknya dipilih cluster yang memiliki jarak ketinggian paling jauh dari cluster tersebut ke cluster sebelumnya. Hal tersebut dapat digunakan garis
bantu, garis merah menandakan jarak dari cluster 2 ke cluster 1, garis biru
dari cluster 2 ke 3 dan oranye dari cluster 4 ke 3. Dapat dilihat bawha garis
merah merupakan garis paling panjang diantara ketiga garis sehingga dapat
dikatakan bahwa pembagian cluster 2 adalah yang paling signifikan. Sedangkan
setelah pembagian dalam 4 cluster (5 cluster dst) tidak memberikan hasil yang
cukup baik dikarenakan ketinggian dari jumlah cluster satu ke jumlah cluster
sebelumnya, memiliki jarak yang pendek.
4. Kesimpulan dan Implikasi Kebijakan
Berdasarkan analisa statistik di atas, dapat ditarik
kesimpulan bahwa :
- 30 hari kerja yang telah dianalisa bisa disimpulkan bahwa rata – rata biaya pemakaian sama per kWh dengan asumsi penggolongan beberapa cluster yaitu :
Cluster 1 ada di Hari Ke – 1,2,3,4,8,9,10,22,24,25,26,27,30
Cluster 2 ada di Hari Ke – 5,6,7,20,21,28,29
Cluster 3 ada di Hari Ke – 11,12,13,14,15,17,18,19
Cluster 4 ada di Hari Ke - 16
3 Cluster
Cluster 1 ada di Hari Ke – 1,2,3,4,8,9,10,22,24,25,26,27,30
Cluster 2 ada di Hari Ke – 5,6,7,20,21,23,28,29
Cluster 3 ada di Hari Ke – 11,12,13,14,15,16,17,18,19
2 Cluster
Cluster 1 ada di Hari Ke –
1,2,3,4,5,6,7,8,9,10,20,21,22,23,24,25,26,27,28,29,30
Cluster 2 ada di Hari Ke – 11,12,13,14,15,16,17,18,19
- Berdasarkan analisa cluster yang telah dilakukan, didapatkan cluster yang memiliki banyak anggota untuk ketiga penggolongan cluster yaitu Cluster 1 dengan persamaan antara ketiganya di Hari Ke - 1,2,3,4,8,9,10,22,24,25,26,27,30. Dari kelompok tersebut bisa untuk diterapkan di 6 buah Gas Turbine sesuai pola – pola standar operasi yang tepat pada hari – hari tersebut sehingga didapatkan konsumsi bahan bakar yang tepat dan hemat.
- Berdasarkan dendogram diketahui bahwa pembagian kluster terbaik hanya sampai 4 kluster. Hal tersebut disebabkan karena jarak antara jumlah kluster 5 ke jumlah kluster 4 dan seterusnya tidak memiliki jarak yang signifikan (jarak yang cukup panjang).
Referensi:
[1] Feriyanto, Y.E. (2017). Tugas & Materi Kuliah Magister Manajemen Teknologi. ITS-Surabaya