Apa itu Biostatistika?

Berasal dari kata asal “biostatistics”, ia mengacu pada aplikasi ilmu statistik untuk disiplin ilmu biologi secara luas, diantaranya ilmu kedokteran dan hayati [Life Sciences]. Berbagai pertanyaan berikut memerlukan Biostatistik untuk memperoleh jawaban:

“Berapa besar angka kejadian Influenza di Indonesia?”

“Apakah anak sekolah SD & SMP memiliki risiko terkena influenza lebih tinggi dibandingkan dengan kelompok umur lain?

“Apakah tinggal di lingkungan perumahan yang padat meningkatkan risiko terkena influenza?”

Biostatistik merupakan ilmu yang berisikan kumpulan metode kuantitatif untuk menyimpulkan berbagai fenomena biologis berdasarkan data empiris yang didapat melalui penginderaan fisik atau observasi.

Untuk aplikasi bidang kedokteran dan kesehatan masyarakat, biostatistik merupakan alat penting untuk: mengembangkan perangkat diagnostik, metode pengobatan baru, pengukuran besar masalah suatu penyakit, identifikasi faktor risiko berbagai penyakit, evaluasi usaha pencegahan penyakit di masyarakat, dan sangat banyak pertanyaan penelitian lain yang memerlukan jawaban melalui pengukuran kuantitatif.

Biostatistik adalah ilmu untuk mengambil kesimpulan dengan bukti, berdasarkan data – data empiris yang diperoleh melalui suatu pengumpulan data/observasi berdasarkan metode ilmiah.

Bagaimana R berinteraksi dengan data

Program R mengenal data sebagai objek dalam berbagai bentuk seperti vektor, dataframe, atau model statistik. Untuk membuat suatu objek, digunakan code “<-“. Contohnya apabila kita ingin input data dengan R, kita bisa membuat objek berupa vektor yang berisikan variabel yang dimaksud. Variabel gender (kode 0= Laki-laki 1=Perempuan) dan ID, masing – masing 5 observasi, maka statement pada R berupa:

> gender <- c(1,1,1,0,0)

>id <- c(1,2,3,4,5)

Kode di atas akan membuat suatu objek berupa vektor “gender” dan “id” yang masing – masing berisikan 5 observasi dengan perintah “c()”. Untuk mencek apakah objek sudah ada dalam “workspace” R kita bisa lakukan dengan statement:

> ls()

Untuk membaca datanya kita tinggal tulis pernyataan:

> gender

>id

Untuk membuat objek dataframe yang berisikan dua variabel tersebut kita gunakan perintah:

> dataset <- data.frame(id, gender)

Untuk mengecek keberadaan objek “dataset” kita gunakan pernyataan:

> View (dataset)

Perhatikan V berupa kapital pada statement”View”, statement pada R bersifat case sensitive.

Set up working directory

Agar mudah untuk membaca file, akan lebih mudah kalau data-date tersebut kita simpan secara konsisten di working directory dari R. Untuk mengetahui di mana working direktori dari R, kita gunakan code getwd(). Untuk menset working direktori di direktori atau folder d misalkan: “setwd(“d:\”)

Format dan Penyimpanan Data untuk Analisis Statistik Menggunakan R

Untuk memudahkan pengguna R, saya anjurkan untuk menggunakan file dataset dengan format “tab delimited” atau “comma delimited” . Jenis file seperti ini dapat dibuat melalui program microsoft excel, dengan “save as” dalam bentuk “tab delimited” atau”comma delimited”  sehingga file akan berekstension “.txt” atau “.csv”. Selanjutnya simpan data di working directory R dan perintahkan untukmembaca file tersebut dengan syntax  read.delim atau read.csv. sebagai berikut:

# membaca file bernama data1.txt atau data1.csv yang disimpan di working directory R dan object diberi nama ds

ds <- read.delim(‘data1.txt’)

ds<- read.csv(‘data1.csv’)