hb_alim b488de8a09 feat: rewrite all 16 worksheets with full learning material

Each worksheet now includes Ringkasan Materi, Template A.x,
3 exercises with example answers, and reflection prompts.
Synced from rti-20252 student repo.

2026-03-31 10:58:25 +07:00

5.9 KiB

Raw Permalink Blame History

WS-14: Analysis, Interpretation & Failure Analysis

Bab 14 — Analisis Data, Interpretasi & Failure Analysis

Ringkasan Materi

Data → Knowledge Model

Data → Analysis → Interpretation → Explanation → Knowledge

Tiga level yang berbeda:

Analysis — "Apa yang terjadi?" (deskriptif + inferensial)
Interpretation — "Apa artinya?" (konteks RQ + literatur)
Failure Analysis — "Mengapa tidak berhasil?" (boundary conditions)

Beyond p-value

Statistical significance ≠ practical significance. Selalu laporkan:

p-value (signifikansi statistik)
Effect size (besarnya efek)
Confidence interval (rentang ketidakpastian)

Effect Size (Cohen's d)	Interpretasi
< 0.2	Small
0.2 – 0.8	Medium
> 0.8	Large

Pemilihan Uji Statistik

Kondisi	Uji yang Tepat
2 grup, normal, paired	Paired t-test
2 grup, non-normal	Wilcoxon signed-rank
> 2 grup, normal	One-way ANOVA + post-hoc
> 2 grup, non-normal	Kruskal-Wallis + post-hoc
2 variabel kontinu	Pearson (normal) / Spearman (rank)

Failure Analysis as Contribution

Hipotesis yang ditolak adalah temuan yang berharga:

Dataset	New (F1)	Baseline (F1)	p-value	Cohen's d
DS-1 (small, clean)	94.2±1.1	89.3±1.5	<0.001	3.7
DS-4 (medium, noisy)	78.3±3.2	82.1±2.8	0.008	-1.3
DS-5 (large, noisy)	71.6±4.1	80.5±3.0	<0.001	-2.5

Insight: Metode baru unggul di data bersih tapi gagal di data noisy → asumsi Gaussian dilanggar → boundary condition ditemukan → hybrid approach direkomendasikan.

Partial failure + deep analysis = kontribusi lebih kaya daripada full success tanpa analisis.

Limitation Types

Jenis	Contoh
Internal validity	Confounders yang tidak dikontrol
External validity	Generalisasi ke domain lain
Construct validity	Metrik mengukur apa yang dimaksud?
Statistical limitation	Sample size, asumsi distribusi

Jebakan Kognitif

"Signifikan statistik = penting secara praktis" → cek effect size
"Hipotesis tidak didukung → cari sudut baru" → p-hacking
"Kegagalan tidak perlu dilaporkan detail" → missed insight
"Limitasi cukup disebutkan, tidak perlu dianalisis" → kedalaman hilang

Template A.14 — Analysis & Interpretation Report

ANALYSIS & INTERPRETATION

1. Statistik Deskriptif:
   | Skenario | Mean | Std | Median | Min | Max | n |
   |----------|------|-----|--------|-----|-----|---|
   |          |      |     |        |     |     |   |

2. Uji Hipotesis:
   Uji yang digunakan  : ____________________
   Justifikasi          : ____________________
   Hasil: p = ____, effect size (d/r/η²) = ____
   CI 95%               : [____, ____]

3. Keputusan:
   [ ] H₀ ditolak → H₁ diterima
   [ ] H₀ tidak ditolak

4. Interpretasi:
   Hubungan ke RQ       : ____________________
   Practical significance: ____________________
   Perbandingan literatur: ____________________

5. Limitation:
   | Jenis | Ancaman | Dampak | Mitigasi |
   |-------|---------|--------|----------|
   |       |         |        |          |

6. Failure Analysis (jika H₀ tidak ditolak):
   Penyebab potensial  : ____________________
   Boundary condition   : ____________________
   Insight              : ____________________

Latihan 1 — Pemilihan Uji Statistik

Tentukan uji statistik yang tepat untuk eksperimen Anda.

Pertanyaan	Jawaban
Berapa grup yang dibandingkan?	Contoh: 3 (BERT, LSTM, SVM)
Apakah data berpasangan (paired)?
Apakah distribusi normal? (uji normalitas)
Uji yang dipilih:
Justifikasi:

Effect size yang akan dilaporkan: [ ] Cohen's d / [ ] Eta-squared / [ ] Lainnya: ____

Latihan 2 — Interpretasi Hasil

Gunakan data berikut (atau data riil Anda) untuk berlatih interpretasi.

Data:

Model	Accuracy (mean ± std)	n
A	89.2 ± 1.5	10
B	87.8 ± 2.1	10

p = 0.045, Cohen's d = 0.74, CI 95% = [0.03, 2.77]

Aspek	Interpretasi
Signifikansi statistik	Contoh: p < 0.05 → signifikan pada α=0.05
Effect size	Contoh: d=0.74 → medium-to-large effect
Practical significance
Hubungan ke RQ
Perbandingan literatur

Latihan 3 — Failure Analysis

Latih kemampuan failure analysis: hipotesis TIDAK didukung. Apa yang bisa dipelajari?

Skenario: Metode baru Anda mendapat F1 = 83.2%, baseline = 84.7%. p = 0.12 (tidak signifikan).

Pertanyaan	Jawaban
Apakah ini "gagal"?	Contoh: Bukan gagal total — hipotesis tidak terdukung adalah temuan yang valid dan bisa menjadi kontribusi.
Kemungkinan penyebab?	Contoh: Metode baru menambah kompleksitas komputasi (+40% waktu) tanpa peningkatan F1 yang cukup — overhead tidak sebanding.
Boundary condition?	Contoh: Metode ini hanya efektif ketika data ≥ 10.000 record; di dataset kecil (<1.000), baseline lebih stabil.
Insight yang bisa diambil?	Contoh: Ada trade-off ukuran data vs kompleksitas — rekomendasikan hybrid approach yang adaptif berdasarkan ukuran dataset.
Apakah layak dilaporkan? Mengapa?	Contoh: Ya — negative result + boundary condition analysis adalah kontribusi riset yang diakui komunitas (ex: ACL, SIGIR). Mencegah riset duplikasi yang berulang.

Limitation terkait:

Jenis	Ancaman	Dampak
Contoh: Statistical	Contoh: Hanya 5 run per skenario	Power test rendah

Refleksi

Apakah "failure" dalam riset benar-benar gagal, atau justru kontribusi? Bagaimana failure analysis mengubah cara Anda melihat hasil negatif?

5.9 KiB Raw Permalink Blame History Unescape Escape