Minggu, 25 Juli 2021

Pengukuran Tendensi Sentral

MEASURE OF CENTRAL TENDENCY DALAM STATISTIKA

A. Apa itu Measure of Central Tendency?

Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.

    1. Mean

        a. Definisi
        Mean dari suatu dataset merupakan penjumlahan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri pada dataset tersebut.

        b. Mean: contoh

        c. Kelebihan dan Kekurangan


    2. Median

        a. Definisi
        Median dari suatu dataset merupakan nilai yang berada di tengah dengan mengacu pada nilai dataset yang sudah terurut.
  • Untuk dataset dengan jumlah entri ganjil, nilai median dapat diperoleh dari nilai yang tepat berada di tengah.
  • Untuk dataset dengan jumlah entri genap, nilai median diperoleh dari rerata dua nilai yang berada di tengah.
        b. Median: contoh

    3. Mode

        a. Definisi
        Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.
  • Suatu dataset dapat memiliki lebih dari satu mode (multi-modal).
  • Suatu dataset juga bisa saja tidak memiliki mode, ketika frekuensi kemunculan dari tiap datanya sama.
        b. Mode: Contoh














Visualisasi Data

VISUALISASI DATA DALAM STATISTIKA

Pengantar

Beberapa teknik visualisasi data yang akan dipelajari:

  • Stem and Leaf Plot
  • Dot Plot
  • Pie Chart
  • Bar Plot
  • Scatter Plot
  • Time Series Chart
  • Visualisasi Data dengan Python

1. Stem and Leaf Plot

    a. Stem and Leaf Plot [1/2]

b. Stem and Leaf Plot [2/2]

2. Dot Plot

3. Pie Chart


4. Bar Plot

5. Scatter Plot


6. Time Series Chart

DISTRIBUSI FREKUENSI

Distribusi Frekuensi dalam Statistika

A. Pengantar

  • Beberapa karakteristik yang umum digunakan untuk mendeskripsikan data yang kita miliki adalah dengan mencari tahu titik tengah data (center), variasi/sebaran data (variability/spread), dan bentuk data (shape).
  • Ini bisa dicapai bila data yang kita miliki dikelola dengan baik; salah satu cara yang paling mudah untuk mengelola data adalah dengan memanfaat distribusi frekuensi (frequency distribution)

B. Distribusi Frekuensi (Frequency Distribution)

1. Definisi

  • Distribusi frekuensi adalah bentuk pengelolaan data di mana data dikelompokkan ke dalam beberapa kelas (classes) berdasarkan interval tertentu.
  • Jumlah kemunculan data untuk tiap kelas akan dihitung dan dikenal sebagai frekuensi dari kelas.


2. Frequency Distribution: contoh

    
  • Terdapat 6 classes
  • Antar classes tidak ada overlap
  • Setiap class memiliki
    • Lower Class Limit 1, 6, 11, 16, 21, 26
    • Upper Class Limit 5, 10, 15, 20, 25, 30
    • Class Width:5




3. Membuat Distribusi Frekuensi


C. Mengenal midpoint, relative frequency, dan cummulative frequency


D. Visualisasi Data dengan Python

    1. Visualisasi Data: Histogram


    2. Visualisasi Data: Frequency Polygon

    3. Visualisasi Data: Ogive

PENGUMPULAN DATA DALAM STATISTIKA

Pengumpulan Data (Data Collection)

1. Census

Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan

2. Sampling

Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi yang diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik. Di sini sample yang baik adalah sample yang dapat merepresentasikan populasinya. Dibutuhkan teknik sampling yang tepat untuk mendapatkan sample yang representatif terhadap populasinya.

    a. Sampling Error

Karena sample merupakan sub bagian dari populasi, maka selisih atau perbedaan nilai antara data sample dan data populasi akan selalu ada.
Perbedaan atau selisih nilai ini dikenal dengan istilah sampling error.
Bahkan dengan teknik sampling sebaik apapun, sampling error ini tidak dapat dihindarkan.

    b. Sampling: with/without Replacement

Sampling with replacement: Memungkinkan satu anggota populasi untuk terpilih lebih dari satu kali sebagai anggota sample.
Sampling without replacement: Menjamin satu anggota populasi hanya dapat terpilih satu kali saja sebagai anggota sample.

    c. Teknik Sampling (Sampling Techniques)

        Teknik sampling dalam bidang statistika:
  • Simple Ramdom Sampling
  • Stratified Sampling
  • Cluster Sampling
  • Systematic Sampling
  • Convenience Sampling

    1. Sampling Technique: Simple Random Sampling

Simple random sampling merupakan teknik pengumpulan data dilakukan secara yang acak di mana setiap anggota populasi memiliki peluang yang sama untuk dapat terpilih sebagai anggota sample.

Contoh: Terdapat 400 siswa terdaftar di kelas statistika dan kita diminta untuk melakukan sampling secara acak terhadap 10 orang siswa untuk dilibatkan dalam survey. Salah satu cara yang dapat ditempuh adalah dengan memberikan sebuah nomor pada tiap siswa, mulai dari nomor 1 sampai dengan 400. Lalu gunakan random number generator untuk melakukan pemilihan acak sebanyak 10 kali dengan rentang nilai pengacakan mulai dari 1 sampai dengan 400.

    2. Sampling Technique: Stratified Sampling

  • Stratified sampling merupakan teknik pengumpulan data secara acak yang dilakukan dengan terlebih dahulu membagi anggota populasi ke dalam beberapa kelompok berdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin, tingkat pendapatan, etc).
  • Kelompok yang terbentuk ini biasa dikenal dengan istilah strata.
  • Selanjutnya anggota dari tiap strata tersebut akan dipilih secara acak untuk dijadikan anggota sample.
  • Perlu diingat agar sampling yang dilakukan di tiap strata haruslah proporsional dengan proporsinya dalam populasi.

Sampling Technique: Stratified Sampling (ilustrasi)

Sampling Technique: Stratified Sampling (contoh)
Dilakukan survey terhadap 100 orang mahasiswa baru terkait preferensi mereka dalam memilih menu makan siang. Dari populasi mahasiswa baru ini, dihasilkan dua buah strata berdasarkan jenis kelamin (pria dan wanita). Mengacu pada data penerimaan mahasiswa, didapati 3500 mahasiswa baru yang terdaftar dengan persentase jumlah mahasiswa pria dan wanita adalah 55%-45%. Oleh karenanya survey ini akan melibatkan 55 mahasiswa pria dan 45 mahasiswa wanita yang dipilih secara acak.

    3. Sampling Technique: Cluster Sampling

  • Cluster sampling merupakan teknik pengumpulan data secara acak yang dilakukan dengan membagi anggota populasi ke dalam beberapa kelompok berdasarkan pengelompokkan yang sudah terbentuk (e.g., area geografis, kecamatan, kelurahan, etc).
  • Kelompok yang terbentuk ini biasa dikenal dengan istilah cluster.
  • Selanjutnya anggota dari tiap cluster tersebut akan dipilih secara acak untuk dijadikan anggota sample.
  • Perlu diingat agar sampling yang dilakukan di tiap cluster haruslah proporsional dengan proporsinya dalam populasi.

Sampling Technique: Cluster Sampling (ilustrasi)

Sampling Technique: Cluster Sampling (contoh)
Dilakukan pendataan jenis dan jumlah kendaraan bermotor yang dimiliki oleh tiap keluarga di wilayah Kecamatan Suka Jaya. Karena wilayah kecamatan ini terbagi ke dalam 7 kelurahan; maka pendataan dilakukan secara acak di tiap kelurahan dengan jumlah sample yang proporsional sesuai dengan persentase jumlah warga di tiap kelurahannya.

    4. Sampling Technique: Systematic Sampling

Systematic sampling merupakan teknik pengumpulan data berdasarkan interval tertentu. Teknik sampling ini terbilang cukup mudah untuk diterapkan. Hanya saja teknik ini tidak dapat diterapkan bila ditemui adanya pola yang sifatnya konsisten dan sistematis pada data kita.

Contoh: Survey terkait kepuasan pelanggan mini market yang dilakukan terhadap setiap pengunjung dengan interval kedatangan 10. Dengan kata lain, bila pengunjung yang sedang dilibatkan dalam survey saat ini adalah pengunjung ke 5, maka pengunjung berikutnya yang akan dilibatkan dalam survey adalah pengunjung ke 15.

    5. Sampling Technique: Convenience Sampling

Convenience sampling merupakan teknik pengumpulan data yang bisa dibilang asal atau sembrono dan hanya berorientasi pada kemudahan. Ini merupakan teknik pengumpulan data yang buruk dan sangat rentan terhadap bias.

Contoh: Suatu survey dilakukan untuk mendata opini warga Kecamatan Suka Pintar (yang terbagi dalam 7 kelurahan) terkait layanan masyarakat yang disediakan oleh aparat kecamatan. Dikarenakan alasan kemudahan, maka satu kelurahan ditunjuk sebagai perwakilan dan survey dilakukan terhadap warga kelurahan tersebut yang dipilih secara acak.

Minggu, 18 Juli 2021

DESAIN EKSPERIMEN DALAM STATISTIKA

Desain Eksperimen dalam Statistika

Studi Statistik (Statistical Study)

    a. Studi Observasi (Observational Study)

        Seorang peneliti hanya melakukan pengamatan terhadap subjek (e.g., pengukuran karakteristik) tanpa melakukan tindakan apapun yang dapat mempengharuhi hasil pengamatan.

        Observational Study: contoh

        Sebuah penelitian dilakukan untuk mengamati laju kecepatan kendaraan yang melintas di Jalan Merdeka pada pukul 10 sampai dengan 12 malam.

        Pengukuran kecepatan kendaraan dilakukan dengan bantuan speed gun selama 90 hari.

    b. Studi Eksperimen (Experimental Study)

        Seorang peneliti menerapkan suatu treatment tertentu terhadap subjek sebelum melakukan pengamatan untuk memahami efek dari treatment yang diberikan.

        Experimental Study: contoh

        Sebuah penelitian dilakukan untuk mengamati efek dari pemberian suplemen vitamin D3 terhadap 140 pasien dengan tingkat anti-body rendah.

        Sebanyak 70 pasien menerima 4000 IU vitamin D3 perhari selama 1 tahun dan 70 pasien sisanya menerima placebo.

        Hasil pengamatan terhadap dua kelompok pasien ini lalu dibandingkan.


**Desain Eksperimen (Experimental Design)**

1.) Definisi

     1. Kendali (Control)

     2. Pengacakan (Randomisation)

     3. Replikasi (Replication)


        1. Experimental Design: Control (kendali)


        Kendali (control) dapat dilakukan dengan menerapkan:

        a. Bliding

        b. Double Blinding

            a. Blinding

            Subjek eksperimen tidak mengetahui apakah dirinya menerima treatment atau placebo.

            b. Double Blinding

            - Baik peneliti maupun subjek eksperimen tidak mengetahui apakah seorang subjek menerima treatment atau placebo.

            - Dibutuhkan pihak ketiga untuk mendistribusikan treatment dan placebo kepada subjek eksperimen.


         2. Experimental Design: Randomisation (pengacakan)

Penentuan subjek eksperimen ke dalam treatment group dan control group dilakukan secara acak (random).


Randomised Blocked Design:

a. Keseluruhan subjek eksperimen akan dikelompokkan berdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin).

b. Subjek di tiap kelompok lalu dipilih secara acak untuk dimasukkan dalam treatment group dan control group.


        3. Experimental Design: Replication (replikasi)

Untuk meningkatkan validitas dari hasil eksperimen, dibutuhkan replikasi atau pengulangan eksperimen dengan kondisi serupa atau mirip.

Replikasi melibatkan subjek eksperimen yang berbeda, dengan demikian replikasi juga akan memperbesar ukuran dari subjek eksperimen (sample size) yang juga dapat menunjang validitas dari hasil eksperimen.


2.) Desain Eksperimen [contoh]

    Contoh 1:

        Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu produk permen karet yang dikembangkan untuk membantu seseorang yang ingin berhenti merokok.

        Sepuluh orang perokok berat dilibatkan sebagai subjek eksperimen. Lima orang di antaranya diberikan permen karet dan lima sisanya diberikan placebo. Setelah dua bulan berjalan, kesepuluh subjek eksperimen ini dievaluasi dan didapati kelima subjek penerima permen karet telah berhenti merokok.

        Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan apa yang terdapat pada desain eksperimen ini?

Contoh 2:

        Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu produk permen karet yang dikembangkan untuk membantu seseorang yang ingin berhenti merokok.

        Seribu orang perokok berat dilibatkan sebagai subjek eksperimen yang dikelompokkan berdasarkan jenis kelamin. Kelompok wanita diberi permen karet dan kelompok pria diberi placebo. Setelah dua bulan berjalan, keseribu subjek eksperimen ini dievaluasi dan didapati adanya jumlah yang cukup signifikan dari kelompok penerima permen karet yang berhenti merokok.

        Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan apa yang terdapat pada desain eksperimen ini?


3.) Tantangan dalam Experimental Study

a. Confounding/Lurking variable

    Faktor eksternal (dan tidak diperhitungkan sebelumnya) yang berpotensi memberikan pengaruh terhadap hasil eksperimen

b. Placebo effect

    Subjek eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo (treatrace palsu).

c. Hawthorne effect

    Perubahan perilaku dari subjek eksperimen setelah mengetahui bahwa dirinya terlibat dalam eksperimen.

KLASIFIKASI DATA DALAM STATISTIKA

 Klasifikasi Data dalam Statistika

A. Tipe Data

1.      Definisi

        a. Data Kualitatif (Qualitative)

            Data non numerik:

            - Atribut

            - Label

        b. Data Kuantitatif (Quantitative)

            Data numerik yang dihasilkan melalui:

            - Penghitungan

            - Pengukuran

2.    Tipe Data: contoh


B. Skala Pengukuran (Level of Measurements)

    a.    Terdapat 4 Skala Pengukuran (Level of Measurements) dalam bidang statistika:
            1. Nominal
            2. Ordinal
            3. Interval
            4. Rasio (Ratio)

        1. Skala Pengukuran Nominal
        Berasosiasi dengan tipe data kualitatif
    - Berfokus pada pengelompokkan atau pengkategorian data berdasarkan nama, label, atau kualitas
        - Tidak dapat dikenakan operasi matematika
            Contoh:
    • merk kendaraan bermotor
    • kota kelahiran
    • nama siswa, nama bulan, nama hari
    • nomor kendaraan bermotor, nomor induk siswa

 

        2. Skala Pengukuran Ordinal

            - Berasosiasi dengan tipe data kualitatif

            - Data dapat dikelompokkan

            - Data dapat disusun berdasarkan urutan, peringkat, atau ranking

            - Tidak dapat dikenakan operasi matematika

            Contoh:

    • tingkat kepuasan pelanggan: sangat puas, puas, cukup, kecewa, sangat kecewa
    • temperatur udara: panas, sejuk, dingin
    • peringkat siswa di kelas

        3. Skala Pengukuran Interval
            - Berasosiasi dengan tipe data kuantitatif
            - Data dapat dikelompokkan
            - Data dapat disusun berdasarkan urutan, peringkat, atau ranking
            - Dapat dikenakan operasi matematika untuk menghitung selisih nilai
            - Nilai numerik merepresentasikan posisi pada suatu skala ukur tertentu
            - Tidak memiliki nilai nol yang absolut (no inherent zero)
            - Tidak dapat dikenakan operasi matematika terkait perkalian
            Contoh:
    • temperatur udara 32 derajad Celsius
    • tahun 2020

    
    4. Skala Pengukuran Rasio (Ratio)
            - Berasosiasi dengan tipe data kuantitatif
            - Data dapat dikelompokkan
            - Data dapat disusun berdasarkan urutan, peringkat, atau ranking
            - Dapat dikenakan operasi matematika untuk menghitung selisih nilai
            - Memiliki nilai nol yang absolut (inherent zero)
            - Dapat dikenakan operasi matematika terkait perkalian
            Contoh:
    • usia anak 7 tahun
    • berat badan 65 Kg
    • harga nasi goreng Rp 25,000
    b. Skala Pengukuran: ringkasan

PENGANTAR STATISTIKA DASAR

PENGANTAR STATISTIKA

A. Definisi

1. Statistika (Statistics)

Bidang keilmuan yang mencakup

- Pengumpulan data (collecting)

- Pengelolaan data (organising)

- Analisis data (analysing)

- Interpretasi data (interpreting)

data untuk pengambilan keputusan

2. Data

Kumpulan informasi yang diperoleh melalui:

- Pengamatan (observations)

- Penghitungan (counts)

- Pengukuran (measurements)

- Responsi (responses)


B. Populasi & Sampel

1. Definisi:

    a. Populasi (Populations)

      Kumpulan dari keseluruhan pengamatan, penghitungan, pengukuran, atau responsi terhadap topik yang ingin dikaji

b. Sampel (Samples)

- Bagian dari populasi

- Sampel yang baik adalah sampel yang representatif terhadap populasi sehingga dapat digunakan untuk menarik simpulan (conclusions) terhadap populasi

- Oleh karenanya data sampel harus dikumpulkan dengan metode yang tepat (e.g., random sampling)

2. Populasi & Sampel: ilustrasi


    Sampel merupakan bagian dari populasi, dan dari satu populasi yang sama dapat menarik atau membentuk banyak sampel

3. Populasi & Sampel: contoh
    Sampel:
Suatu survey dilakukan di 35 perguruan tinggi di Indonesia untuk menanyakan apakah seorang mahasiswa pernah mengalami bully selama studi di perguruan tinggi.
Didapati 237 dari total 972 responden mengaku pernah mengalami bully selama menjalani studi di perguruan tinggi.

    Populasi:
Warga kompleks perumahan Suka Rapi yang terdiri dari total 45 kepala keluarga berencana untuk mempercantik kompleks dengan melakukan peremajaan paving jalan.
Pendanaan akan dilakukan secara kolektif berdasarkan ukuran lebar dari tiap rumah. Oleh karenanya dilangsungkan pengukuran dan pendataan lebar muka dari tiap rumah.
 

C. Parameter & Statistik

1. Definisi:

a. Parameter

    - Deskripsi numerik dari karakteristik suatu populasi (population)

    - Terdapat hanya satu parameter untuk satu populasi

b. Statistik (Statistic)

    - Deskripsi numerik dari karakteristik suatu sampel (sample)

    - Memungkinkan untuk mendapati sejumlah statistik dengan nilai yang beragam untuk satu populasi yang sama

2. Parameter & Statistik: contoh

    Statistik:

      Dari hasil uji emisi yang dilakukan secara acak terhadap kendaraan bermotor yang melintas di Jalan Suka Makmur, didapati 48% kendaraan tidak memenuhi standar kelayakan.

    Parameter:

Dari hasil ujian saringan masuk perguruan tinggi di Universitas Suka Pintar pada tahun ini, ditemui 78% dari calon mahasiswa memiliki kemampuan analisis numerik di atas ambang batas yang disyaratkan.


D.    Cabang Ilmu Statistika

1. Definisi:

a. Statistika Deskriptif (Descriptive Statistics)

     Cabang ilmu statistika yang berfokus pada:

    a.       Pengelolaan data (organisation)

    b.      Peringkasan data (summarisation)

    c.       Visualisasi data (display/visualisation)

b. Statistika Inferensi (Inferential Statistics)

      Cabang ilmu statistika yang berfokus pada pemanfaatan sampel untuk menarik simpulan terhadap populasi

2. Cabang Ilmu Statistika: contoh

    Statistika Inferensi:

      Sejumlah pria dewasa berusia 48 tahun dilibatkan dalam suatu program penelitian selama 18 tahun Berdasarkan data pengamatan, diprediksi bahwa 70% dari pria yang tidak menikah  akan bertahan hidup pada usia 65 tahun, dan 90% dari pria yang menikah akan hidup pada usia 65 tahun.

    Statistika Deskriptif:

      Berdasarkan data sampel yang diperoleh dari Wall Street, didapati kesalahan yang dilakukan oleh analist dalam melakukan prediksi pendapatan perusahaan IT pada tahun ini mencapai angka 44%.

IMPLEMENTASI ALGORITMA BRANCH & BOUND

IMPLEMENTASI ALGORITMA BRANCH & BOUND           Sebagaimana pada algortima runut-balik, algoritma Branch & Bound juga merupakan meto...