Memahami Empat Variabel Statistik: Nominal, Ordinal, Interval, dan Ratio

Dalam statistik terdapat empat tipe data yang bisa dibedakan, empat tipe data ini juga biasa disebut dengan levels of messurment variabel. Empat variabel ini pertama dikenalkan oleh S. S. Stevens, tahun 1946, dalam paper On the Theory of Scales of Measurement.

Empat variabel ini adalah nominal, ordinal, interval, dan ratio. Apa saja bedanya? mari kita bahas.

Nominal Variabel

Variabel ini digunakan untuk membeakan individual data kedalam bentuk kategori. Just it!, tidak lebih dan tidak kurang. Contohnya adalah, gender, agama, nama benua untuk negara, atau jenis buku di perpustakaan.

Nominal variabel bisa berarti angka, tetapi angka itu tidak memiliki arti sama sekali. Dalam statistik angka ini tidak dapat dihitung. Adapun yang paling mungkin adalah menghitung berapa banyak satu kategori dibanding kategori yang lain.

Visualisasi data yang mungkin untuk tipe data ini adalah pie chart, sedangkan pengukuran yang mungkin adalah mode, range, dan distribusi frekuensi.

Dalam bahasa pemrograman R, untuk membuat variabel nominal, digunakan fungsi factor().

# buat tipe data nominal
benua <- factor(c('Asia', 'Australia', 'Africa', 'America', 'Europe'))
 
# print
benua
# [1] Asia      Australia Africa    America   Europe   
# Levels: Africa America Asia Australia Europe
 
# cek tipe data
class(benua)
# [1] "factor"

Ordinal Variabel

Ordinal variabel sama seperti nominal variabel, hanya saja pada ordinal variabel setiap data bisa diurutkan. Contohnya adalah negara yang diurutkan berdasarkan populasi penduduk, ranking di satu kelas, klasmen suatu liga, dll.

Dalam ordinal variabel, beda data satu dengan data lainnya adalah unik dan tidak bisa diukur beda satu data dengan data yang lain. Dalam arti, beda satu data dengan data lain tidak berarti apa-apa (meaningless) selain urutan.

Pengukurn yang mungkin dilakukan pada tipe data ini adalah mode, range, distribusi frekuensi, measurement of center, dan urutan coefficient of correlations.

Dalam R, cukup menambahkan parameter order=TRUE untuk merubah factor nominal ke factor ordinal.

# inisialisasi vektor suhu
suhu <- c('Tinggi', 'Rendah', 'Sedang')
 
# buat factor ordinal variabel
factor_suhu <- factor(suhu, order=TRUE, levels=c('Rendah', 'Sedang', 'Tinggi'))
 
# print
factor_suhu
# [1] Tinggi Rendah Sedang
# Levels: Rendah < Sedang < Tinggi
 
is.ordered(factor_suhu)
# [1] TRUE

Selain menambahkan parameter order=TRUE, kita juga bisa membuat factor ordinal dengan fungsi ordered(x, ...).

suhu2 <- c('Tinggi', 'Rendah', 'Sedang')
factor_suhu2 <- factor(suhu2)
 
is.ordered(factor_suhu2)
# [1] FALSE
 
factor_suhu2 <- ordered(factor_suhu2, levels=c('Rendah', 'Sedang', 'Tinggi'))
 
is.ordered(factor_suhu2)
# [1] TRUE

Interval Variabel

Interval variabel juga adalah variabel yang digunakan untuk mengurutkan data, hanya saja pada interval variabel, beda satu data dengan data selanjutnya sama dan memiliki arti/bisa di ukur (meaningfull).

Dalam variabel interval, angka 0 (nol) tidak dapat mewakili arti angka tersebut. Contohnya seperti nilai ujian nasional matematika untuk siswa x, bukan berarti bahwa siswa x tidak bisa matematika sama sekali.

Pengukurn yang mungkin dilakukan pada tipe data ini adalah mode, range, distribusi frekuensi, measurement of center, urutan coefficient of correlations, mean, dan standard deviation.

Contoh dalam R, tinggi suhu dalam Celcius, suhu 0o C bukan berarti tidak ada suhu sama sekali:

# buat celcius_vector
celcius_vector <- c(0,10,20,30,40,50,60,70,80,90)
 
# print
celcius_vector
# [1]  0 10 20 30 40 50 60 70 80 90

Ratio Variabel

Ratio variabel sangat mirip dengan variabel interval, yang membedakan hanyalah true zero point pada variabel interval. Artinya angka 0 (nol) dapat mewakili angka tersebut atau gampangnya angka nol memiliki arti. Contohnya adlah populasi 0 (tidak ada populasi sama sekali) atau berat 0 miligram (tidak memiliki berat sama sekali).

Semua operasi statistik bisa digunakan pada variabel ratio, selama datanya cocok.

Contoh dalam R adalah suhu dalam kelvin, suhu 0o K berarti tidak memiliki suhu sama sekali.

# buat kelvin_vector
kelvin_vector <- c(0,50,100,150,200,250,300,350)
 
# print
kelvin_vector
# [1]   0  50 100 150 200 250 300 350

Nominal vs Order vs Interval vs Ratio

Beda empat tipe diatas secara garis besar ditunjukan pada tabel di bawah:

[table “3” not found /]

Dalam statistik, jika mungkin, ambilah data yang levelnya tinggi, kaena lebih tinggi level, lebih banyak juga operasi statistik yang bisa kita terapkan pada data tersebut.

Tabel di bawah saya buat untuk menunjukan operasi statistik/parameter apa saja yang mungkin dilakukan pada empat tipe variabel di atas.

[table “4” not found /]

**

Semoga tulisan di atas dapat membantu teman-teman membedakan empat tipe variabel pengukuran statistik. Jika belum bisa membedakan, jangan khawatir, saya juga perlu banyak waktu untuk bisa benar-benar membedakan empat variabel di atas. Feel free to comment below if needed 😉 I’m happy to answer that.

Bacaan lanjutan:
https://statistics.laerd.com/statistical-guides/types-of-variable.php
https://www.youtube.com/watch?v=LPHYPXBK_ks
https://campus.datacamp.com/courses/intro-to-statistics-with-r-introduction/chapter-one-variables
http://statistics.ats.ucla.edu/stat/r/modules/factor_variables.htm

3 comments… add one
  • manurung simon Nov 22, 2016 @ 20:20

    hasil ujian nasional,termasuk skal apa ya. Mohon share . Thankyou atas infonya. Menambah wawasan

  • ilma Sep 30, 2016 @ 14:25

    Terimakasih, tulisannya sangat membantu

  • Abdullah Aug 13, 2016 @ 16:00

    Maturnuwun , sangat membantu dalam pemahaman 🙂

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.