Statistik Deskriptif dan Statistik Inferensial – AsikBelajar.Com. Analisa statistik merupakan suatu aktvitas yang dilakukan untuk mengolah data penelitian dengan mengunakan metode statistik untuk menghasilkan suau informasi yang berguna. Dilihat dari aktivitas yang dilakukannya, statistik diklasifikasikan menjadi dua yakni statistika deskriptif dan statistika inferensial. Show
Informasi lainya mengenai Statistik Deskriptif dan Statistik Inferensial: Dilihat dari aktivitas yang dilakukannya, terbagi menjadi dua pula yakni statistika deskriptif dan statistika inferensial.
Statistika deskriptif adalah teknik statistik yang memberikan informasi hanya mengenai data yang dimiliki dan tidak bermaksud untuk menguji hipotesis dan kemudian menarik inferensi yang digeneralisasikan untuk data yang lebih besar atau populasi. Statistik deskriptif “hanya” dipergunakan untuk menyajikan dan menganalisis data agar lebih bermakna dan komunikatif dan disertai perhitungan-perhitungan “sederhana” yang bersifat lebih memperjelas keadaan dan atau karakteristik data yang bersangkutan (Burhan Nurgiyantoro dkk, 2000;8). Baca juga: Penggolongan Statistik Menurut Anas Sudijono
Statistik deskriptif adalah statistik yang menggambarkan kegiatan berupa pengumpulan data, penyusunan data, pengolahan data, dan penyajian data dalam bentuk tabel, grafik, ataupun diagram, agar memberikan gambaran yang teratur ringkas, dan jelas mengenai suatu keadaan atau peristiwa. (M.Subana dkk, 2000;12). Statistika deskriptif bermaksud menyajikan, mengolah dan menganalisa data dari kelompok tertentu sebagaimana adanya dan tidak bermaksud menarik kesimpulan-kesimpulan yang berlaku bagi kelompok-kelompok yang lebih besar. Artinya kesimpulan yang ditarik melalui deskriptif hanya berlaku bagai kelompok sampel yang bersangkutan tanpa dimaksudkan menarik kesimpulan yang berlaku bagi populasi. Ukuran statistik yang lazim digunakan untuk mendeskripsikan karakteristik sampel ialah: ukuran kecenderungan sentral; Ukuran variasi ; Ukuran letak; koefisien korelasi. Sekalipun statistika deskriptif ini hanya menyajikan karakteristik sampel, namun statistika deskriptif merupakan dasar untuk mengkaji dan melakukan inferensi karakteristik populasi. Pengertian statistik deskriptif berbeda dengan statistik inferensial. Pada statistik deskriptif penelitian hanya menggambarkan keadaan data apa adanya melalui parameter-parameter seperti mean, median, modus, distribusi frekuensi dan ukuran statistik lainnya. Pada statistika deskriptif, yang perlu disajikan adalah: 1. Ukuran pemusatan data (measures of central tendency). Ukuran pemusatan data yang sering digunakan adalah distribusi frekuensi. Ukuran statistik ini cocok untuk data nominal dan data ordinal (data kategorik). Sementara nilai mean adalah ukuran pemusatan data yang cocok untuk data continuous. Ukuran deskriptif lain untuk pemusatan data adalah median (nilai tengah) dan modus (nilai yang paling sering muncul). 2. Ukuran penyebaran data (measures of spread). Ukuran penyebaran data yang sering digunakan adalah standar deviasi. Ukuran penyebaran data ini cocok digunakan untuk data numerik atau continuous. Sementara untuk data kategorik, nilai range merupakan ukuran yang cocok. Sedangkan penelitian inferensial adalah proses pengambilan kesimpulan-kesimpulan berdasarkan data sampel yang lebih sedikit menjadi kesimpulan yang lebih umum untuk sebuah populasi. Penelitian inferensial diperlukan jika peneliti memiliki keterbatasan dana sehingga untuk lebih efisien penelitian dilakukan dengan mengambil jumlah sampel yang lebih sedikit dari populasi yang ada. Pada penelitian inferensial, dilakukan prediksi. Statistik inferensial membutuhkan pemenuhan asumsi-asumsi. Asumsi paling awal yang harus dipenuhi adalah sampel diambil secara acak dari populasi. Hal tersebut diperlukan karena pada statistika inferensial perlu keterwakilan sampel atas populasi. Asumsi-asumsi lain yang perlu dipenuhi mengikuti alat analisis yang digunakan. Jika yang digunakan adalah analisis regresi, maka asumsi-asumsi data harus memenuhi asumsi analisis regresi. Metode analisis statistik yang digunakan dalam statistik inferensial adalah T-test, Anova, Anacova, Analisis regresi, Analisis jalur, Structural equation modelling (SEM) dan metode analisis lain tergantung tujuan penelitian. Dalam statistik inferensial harus ada pengujian hipotesis yang bertujuan untuk melihat apakah ukuran statistik yang digunakan dapat ditarik menjadi kesimpulan yang lebih luas dalam populasinya. Ukuran-ukuran statistik tersebut dibandingkan dengan pola distribusi populasi sebagai normanya. Oleh sebab itu, mengetahui pola distribusi data sampel menjadi penting dalam statistik inferensial. Contoh yang baik untuk statistik inferensial adalah pada pemilu presiden 2014. Berbagai lembaga survei melakukan quick count untuk mengetahui secara cepat kandidat presiden mana yang akan mendapatkan suara rakyat lebih banyak. Lembaga survei tersebut mengambil sebagian sampel TPS (Tempat Pemungutan Suara) dari total TPS populasi. Hasil sampel TPS tersebut digunakan untuk generalisasi terhadap keseluruhan TPS. Katakanlah diambil 2.000 sampel TPS dari 400.000 populasi TPS yang ada. Hasil dari 2.000 TPS adalah statistik deskriptif. Sedangkan jika kita mengambil kesimpulan terhadap 400.000 TPS adalah statistik inferensial.Kekuatan statistik inferensial tergantung pada teknik pengambilan sampel dan proses randomisasi. Jika proses randomisasi dilakukan dengan benar, maka sampel yang lebih sedikit dapat memprediksi nilai populasi dengan baik. Dengan demikian dapat menghemat anggaran pengambilan / pengumpulan data. Di industri manufaktur, statistik inferensial sangat berguna. Manajemen dapat mengetahui dan mengontrol berapa produk yang di luar standar atau cacat dengan hanya mengambil beberapa sampel produk. Bayangkan jika manajemen perusahaan harus memeriksa semua produk hanya untuk mengetahui berapa yang cacat. Tentu akan menghabiskan waktu dan biaya yang tidak sedikit. Terlebih jika harus memeriksa semua produk yang dikemas. Tentu tidak efektif dan efisien. Untunglah ada Six Sigma, salah satu tool yang digunakan terkait hal ini. Prinsip Six Sigma menggunakan statistik inferensial yaitu mengambil sampel produk dan mengukur sigma atau standar deviasi (ukuran keragaman) dari produk. Jumlah produk yang cacat tidak boleh melebihi standar yang ditetapkan. Sumber referensi: 1. http://www.socialresearchmethods.net/kb/statinf.php Untuk bantuan analisa / olah data statistik dengan SPSS, Lisrel Amos dapat 081318082288 atau Order Online
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna. Statistika deskriptif digunakan untuk mendeskripsikan, meringkas dan membuat summary data agar lebih mudah dibaca dan digunakan. Statistika deskriptif dibedakan dengan statistik inferensial. Statistika deskriptif bertujuan untuk memberikan ringkasan dari sampel data dan tidak menggunakan data untuk membuat kesimpulan atas populasi. Di dalam tulisan ini, akan dijelaskan mengenai statistika deskriptif, meliputi pengertian, perbedaannya dengan statistika inferensial, fungsi statistika deskriptif, hingga bagaimana melakukan analisis statistika deskriptif menggunakan tabel, grafis dan numerik, berikut contohnya. Namun sebelumnya, mari kita kembali melihat statistika itu apa. Photo by Lukas from PexelsPengertian statistikaStatistika adalah cabang dari ilmu matematika yang berhubungan dengan bagaimana cara merencanakan, mengumpulkan, menganalisis, menginterpretasikan, dan mempresentasikan data. Statistika sangat bermanfaat untuk banyak hal. Memahami statistika sangat membantu kita memahami banyak informasi yang semakin ke sini semakin banyak ditampilkan menggunakan statistika. Memahami statistika membuat pemahaman kita terhadap data dan informasi lebih terstruktur. Kita juga bisa memanfaatkan statistika dalam berbagai hal, misalnya, kita bisa menyampaikan informasi dengan lebih jelas dengan menggunakan statistika deskriptif terutama menggunakan grafik. Statistika digunakan untuk mengukur parameter dari populasi berdasarkan sampel dan menghitung ketidakpatian dalam pengukuran tersebut. Dengan menghitung aspek ketidakpastian ini, statistik memungkinkan kita untuk melihat seberapa jauh hasil pengukuran kita jika dibandingkan dengan keadaan aslinya. Perhitungan-perhitungan ini dapat dimanfaatkan untuk menyelesaikan masalah dalam sebuah penelitian, pengembangan bisnis, manajemen resiko dan berbagai hal lainnya. Statistika sendiri dapat dibedakan menjadi dua jenis yaitu statistika deskriptif dan statistika inferensial. Perbedaan statistika deskriptif vs statistika inferensialSesuai namanya, statistika deskriptif merupakan proses melakukan kategorisasi dan pendeskripsian informasi. Sedangkan statistika inferensial mencakup proses analisis pada data yang diperoleh dari proses sampling dan digunakan untuk membuat pendugaan populasi di mana sampel diambil. Contoh dari proses statistika inferensial adalah pengujian hipotesis. Statistika deskriptif kurang lebih merupakan metode untuk merangkum informasi yang telah kita kumpulkan. Rangkuman informasi biasa ditampilkan dalam bentuk grafik atau dalam bentuk nilai rata-rata, persentase dan yang lainnya. Statistika inferensial dilakukan dengan membuat kesimpulan tentang suatu populasi berdasarkan sampel yang terbatas. Proses ini berkaitan erat dengan proses pendugaan estimasi terhadap parameter. Statistika inferensial adalah bagian statistika yang membahas cara melakukan analisi data, menaksir, meramalkan, dan menarik kesimpulan terhadap data, fenomena, persoalan yang lebih luas atau populasi dari data. Kegiatan statistika inferensial meliputi: pengujian hipotesis, estimasi dan mengambil keputusan. Ruang lingkup statistika inferensial meliputi analisis korelasi, regresi, analisis varians, kovarians dan uji statistik lainnya. Statistika deskriptif bertujuan untuk memberikan ringkasan dari sampel data dan tidak menggunakan data untuk membuat kesimpulan atas populasi. Berikut ringkasan perbedaan statistika deskriptif dan statistika inferensial: Tabel perbedaan statistika deskriptif dan statistika inferensial
Adapun dalam tulisan ini, sesuai judul, akan dibahas lebih lanjut mengenasi statistika deskriptif. Pengertian statistika deskriptifSecara ringkas, statistika deskriptif merupakan cara-cara untuk mendeskripsikan data kita. Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna. Statistika deskriptifPhoto by Lukas from Pexels Statistika deskriptif memberikan ringkasan sederhana dari sampel dan pengamatan yang kita sudah lakukan. Ringkasan ini dapat berbentuk angka (kuantitatif) seperti ringkasan statistik (mean, median, dll) dan secara visual misalnya dengan diagram batang atau diagram garis. Saya berikan contoh. Bayangkan kita punya dataset yang berisi nilai Ujian Nasional dari semua siswa kelas 6 di sebuah sekolah dasar A. Daripada kita menyebutkan nilai setiap siswa satu per satu, untuk menceritakan datanya, kita dapat menyebutkan statistiknya saja, misal nilai tertinggi, nilai terendah dan nilai rata-rata. Alternatif yang lain, kita dapat menggunakan diagram batang untuk menampilkan distribusi nilai UN, atau menggunakan pie diagram untuk melihat proporsi datanya. Nah, sesuai dengan penjelasan-penjelasan sebelumnya, angka-angka dan grafik yang dibuat hanya untuk mendeskripsikan data dari siswa kelas 6 di SD A, dan tidak boleh digunakan untuk menyimpulkan nilai UN untuk populasi yang lebih besar, misal untuk tingkat provinsi. Dari contoh tersebut, kumpulan data kita akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari data yang kita miliki dengan menggunakan statistika deskriptif. Fungsi statistika deskriptifPertanyaan selanjutnya adalah, apa pentingnya statistika deskriptif dan mengapa kita memerlukannya? Photo by fauxels from PexelsStatistika deskriptif sangat bermanfaat untuk dua hal:
Statistika deskriptif sangat penting karena jika kita hanya memunculkan data asli yang kita miliki, informasi dan insight dari data tersebut sangat sulit didapatkan, apalagi jika datanya memiliki record yang sangat besar. Dalam hal ini, statistika deskriptif memungkinkan kita untuk menampilkan data dengan lebih jelas dan bermakna, sehingga interpretasi terhadap data tersebut mudah dilakukan. Sebagai contoh, kita memiliki data tentang nilai UN matematika dari pelajar SMU di Provinsi Aceh. Kita akan lebih tertarik dengan nilai rata-rata, nilai tertinggi, dan distribusi datanya. Dalam konteks data science dan machine learning, setelah mendapatkan data, kita tidak bisa langsung menerapkan algoritma dan membuat prediksi begitu saja. Tentu, pertama kali kita perlu memahami data yang kita miliki. Tahap ini biasa disebut dengan Exploratory Data Analysis (EDA). Dalam EDA, pengetahuan mengenai statistika deskriptif akan sangat membantu. Analisis deskriptifAnalisis deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi. Analisis deskriptif dilakukan dengan menggunakan alat bantu seperti Microsoft Excel 2013, SPSS, atau R. Hasilnya berupa diagram seperti diagram lingkaran dan diagram batang beserta tabel perhitungan analisis data. Keluaran yang dihasilkan berupa tabel dan grafik sehingga pembaca dapat segera mengetahui informasi yang telah diolah dari data tersebut. Untuk melakukan analisis deskriptif, hal yang pertama yang harus kita ketahui adalah tipe atau jenis datanya. Setelah itu, kita bisa lakukan analisis deskriptif meliputi beberapa hal, yakni distribusi frekuensi, pengukuran tendensi pusat, dan pengukuran variabilitas. Analisis deskriptif dapat berupa angka seperti mean, median, standar deviasi, jangkauan, variansi. Hasil analisis deskriptif juga dapat disajikan melalui bentuk grafik. Untuk lebih jelasnya, baca penjelasan berikutnya. Tipe atau jenis dataData dapat kita bagi menjadi:
Data kategorikalData kategorikal merupakan data yang menggambarkan data yang terklasifikasi berdasarkan kategori atau kelas tertentu. Data kategorikal tidak bisa dihitung secara kuantitatif sehingga tidak dapat menerima operasi matematik seperti penjumlahan dan perkalian. Contoh data kategorikal:
Data numerikalData numerikal adalah kelompok data yang menunjukkan nilai atau kuantitas. Data ini dapat menerima operasi matematik. Kelompok data numerikal memiliki dua sub kelompok yaitu:
Data Numerikal DiskritData diskret merupakan data dengan nilai bilangan bulat, biasanya didapatkan dari proses pencacahan (pembilangan). Contoh dari data diskrit:
Data Numerikal KontinyuData kontinyu adalah kumpulan data yang didapatkan melalui proses pengukuran, sehingga memungkinkan adanya nilai negatif dan bilangan pecahan. Contoh data kontinu:
Penyajian dataData yang sudah kita kumpulkan atau yang kita dapatkan dari sumber lain biasanya berupa matriks data. Atau bahasa sederhananya, dalam bentuk tabel. Mari kita ingat kembali, matriks data terdiri atas variabel, case, observation Data dalam matriks data, biasanya berupa data yang sangat banyak sehingga sulit dibaca. Data tersebut perlu dirangkum dan ditampilkan dalam bentuk yang lebih sederhana. Penyajian data dapat dibagi menjadi Untuk memahami penyajian data menggunakan statistik deskriptif, setelah ini kita akan gunakan contoh data di bawah ini. Contoh data: Nilai UN SDN Wano Dengan menggunakan contoh data ini, kita akan membedah penyajian dan visualisasi data, mulai dari penjelasannya, hingga perhitungan dan cara membuatnya. Perlu dicatat bahwa metode penyajian data statistika deskriptif pada tulisan ini hanya dasar saja, dan tentu masih ada metode-metode turunannya. 1. Penyajian data: tabelKunci dalam membuat tabel adalah tabel harus memberikan informasi yang dapat dimengerti oleh pembaca. Informasi dalam tabel ini harus diusahakan seringkas mungkin. Terdapat perbedaan penyajian berdasarkan jenis datanya: kategorik vs numerik. a. Tabel: kategorikalTabel frekuensiTabel frekuensi memuat data kualitatif (kategorikal) dalam bentuk frekuensi. Jika jumlah data banyak, biasanya ditampilkan pula frekuensi dalam persen. Menggunakan contoh data yang sudah diberikan, berikut adalah contoh tabel frekuensi yang menunjukkan frekuensi siswa berdasarkan jenis kelamin. Tabel KontingensiTabel kontingensi digunakan untuk melihat distribusi dari dua data kategorikal atau lebih. Nilai yang ditampilkan dapat berupa persen baris, persen kolom, sesuai kebutuhan. Menggunakan contoh data yang sudah diberikan, berikut adalah contoh tabel frekuensi yang menunjukkan frekuensi siswa berdasarkan jenis kelamin dan desa asal. b. Tabel: numerikalTabel distribusi frekuensi kelompokTabel distribusi frekuensi kelompok digunakan untuk membuat pengelompokkan data numerik. Tabel ini berisi nilai yang telah dikelaskan, frekuensi masing-masing kelas, serta frekuensi relatif masing-masing kelas. Cara membuat tabel distribusi frekuensi kelompok
Tabel RingkasanTabel ringkasan statistik memuat statistik data, diantaranya jumlah data, rataan, median, simpangan baku, minimum, dan maksimum. Selalu hindari memberikan terlalu banyak informasi dalam tabel ringkasan ini. Grafik lebih cepat mengungkapkan informasi dibandingkan Penyajian data dengan grafik juga dibagi berdasarkan tipe datanya. Pie ChartPie chart atau diagram pie digunakan untuk menampilkan data kategorik khususnya data nominal. Penyajian ini menunjukkan distribusi data dalam group (total 100%). Setiap kelas data disajikan dalam bentuk %, terkadang perlu menyajikan pula jumlah data. Cara membuatnya adalah membuat tabel frekuensi terlebih dahulu, lalu membuat diagramnya. Contoh: Grafik siswa berdasarkan jenis kelamin Informasi mengenai pie chart dapat dibaca di sini dan di sana. Jika jumlah kelas terlalu banyak, pie chart dihindari karena akan sangat sulit dibaca. Ketika jumlah kelas banyak, jangan gunakan pie chart. Gunakan bar chart. Bar ChartBar chart berguna untuk menampilkan data kategorikal. Meskipun demikian, dapat pula digunakan untuk menyajikan data dari tabel kontingensi / tabel ringkasan data Contoh: Grafik siswa berdasarkan jenis kelamin Informasi mengenai bar chart dapat dibaca di sini dan di sana. HistogramHistogram digunakan untuk menunjukkan sebaran frekuensi dari data numerikal. Bisa distribusi dari frekuensi-nya atau frekuensi relatif-nya Histogram dapat digunakan untuk melihat:
Contoh: Histogram untuk nilai B. Inggris Oke mungkin datanya kurang ideal untuk contoh. Hal yang dapat dimodifikasi dalam pembuatan histogram adalah ukuran bin atau ukuran interval yang digunakan dalam klasifikasi nilai di sumbu x. Perbedaan bin size dapat membuat perbedaan histogram seperti ini. Lebih lanjut mengenai histogram dapat dibaca di sini dan di sana. BoxplotBoxplot digunakan untuk menunjukkan pemusatan dan penyebaran data dengan menggunakan kuartil, bentuk sebaran, dan outlier atau data ekstrim. Anatomi boxplot adalah sebagai berikut: (sumber) Jika kita gunakan data contoh kita: Contoh: Lebih lanjut mengenai boxplot dapat dibaca di sini dan di sana. Sebelum melanjutkan membaca, saya menulis mengenai penyajian data secara lebih lengkap pada tulisan ini: Visualisasi Data: Pengertian, Jenis, Metode, dan Contohnya. Penyajian data: numerikPenyajian data secara numerik dilakukan dengan menggunakan ringkasan dari data. Hal ini bertujuan untuk mendeskripsikan data dan mengetahui karakteristik data secara sesederhana tetapi memiliki tetap Penyajian data secara numerik secara umum dapat dibagu menjadi dua yaitu:
Namun, ada juga yang melakukan pengelompokan dengan lebih rinci, meliputi:
Mari kita bedah satu-persatu. Ukuran frekuensiUkuran frekuensi menunjukkan seberapa sering suatu kejadian terjadi. Frekuensi biasa ditunjukkan dengan jumlah rekaman dan persentase. Cara menghitung presentase adalah jumlah rekaman/ jumlah keseluruhan data x 100%. Data frekuensi sering ditampilkan menggunakan tabel frekuensi, juga diagram baik diagram batang maupun pie. Ukuran pemusatanUkuran pemusatan merupakan gambaran (informasi) yang menunjukkan bahwa data mungkin memiliki satu (atau lebih) titik di mana data-data terkumpul atau terpusat.Ukuran pemusatan digunakan untuk menunjukkan suatu nilai Ukuran pemusatan dinyatakan dalam bentuk:
Mean (rata-rata)Mean merupakan nilai rata-rata dari dataset kita. Cara menghitungnya adalah dengan menjumlahkan semua data yang terdapat dalam dataset, dibagi dengan banyaknya data. Misal kita hitung rata-rata nilai B.Ing dari data contoh kita. Caranya seperti ini:
Hasilnya, mean dari nilai B.Ing = 7.1 Modus (mode)Modus atau mode merupakan nilai pengamatan yang paling sering muncul. Dalam satu dataset, dapat pula terdapat lebih dari satu modus. Cara mencarinya dapat dengan menggunakan tabel frekuensi. Misal kita hitung modus dari data nilai Mtk = 5 (4 kali muncul). Median merupakan nilai yang membagi dua sama banyak kumpulan data yang sudah diurutkan. Untuk penjelasan cara menghitungnya, kita gunakan data nilai Mtk dari data contoh kita. Caranya seperti ini.
3, 5, 5, 5, 6, 6, 7, 8, 9, 9
Karena nilainya tidak bulat (5,5) maka kita gunakan rata-rata data uurtan no 5 (X5= 6) dan 6 (X6= 6). Berarti nilai median adalah = (6+6)/2 = 6. Ukuran penyebaranUkuran penyebaran menyatakan sebaran dataset. Ukuran penyebaran dinyatakan dengan:
JangkauansumberJangkauan menunjukkan interval dari data kita. Jangkauan merupakan suatu ukuran yang dihitung dari selisih pengamatan terkecil dengan pengamatan terbesar. Jangkauan merupakan ukuran untuk mengukur penyebaran data yang simetris, di mana nilai pengamatannya menyebar merata. Namun, ukuran ini dapat menjadi tidak relevan jika pengataman maksimum dan minimum merupakan outlier atau data-data yang ekstrim. Contoh perhitungan jangkauan kita lakukan dengan menggunakan kolom nilai MTK. Jangkauan dapat dihitung dengan mudah yaitu:
3, 5, 5, 5, 6, 6, 7, 8, 9, 9
9-3=6 Ragam/ VariansiRagam menunjukkan perbedaan antara data dengan rata-ratanya. Ragam atau variansi merupakan ukuran penyebaran data yangmengukur rata-rata jarak kuadrat semua titik pengamatan terhadap titik rata-rata. |