riset-teknologi-informasi/worksheets/ws-14-analysis-interpretation.md
hb_alim b488de8a09 feat: rewrite all 16 worksheets with full learning material
Each worksheet now includes Ringkasan Materi, Template A.x,
3 exercises with example answers, and reflection prompts.
Synced from rti-20252 student repo.
2026-03-31 10:58:25 +07:00

179 lines
5.9 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# WS-14: Analysis, Interpretation & Failure Analysis
> **Bab 14 — Analisis Data, Interpretasi & Failure Analysis**
---
## Ringkasan Materi
### Data → Knowledge Model
```
Data → Analysis → Interpretation → Explanation → Knowledge
```
Tiga level yang berbeda:
- **Analysis** — "Apa yang terjadi?" (deskriptif + inferensial)
- **Interpretation** — "Apa artinya?" (konteks RQ + literatur)
- **Failure Analysis** — "Mengapa tidak berhasil?" (boundary conditions)
### Beyond p-value
**Statistical significance ≠ practical significance.** Selalu laporkan:
1. p-value (signifikansi statistik)
2. Effect size (besarnya efek)
3. Confidence interval (rentang ketidakpastian)
| Effect Size (Cohen's d) | Interpretasi |
|-------------------------|-------------|
| < 0.2 | Small |
| 0.2 0.8 | Medium |
| > 0.8 | Large |
### Pemilihan Uji Statistik
| Kondisi | Uji yang Tepat |
|---------|---------------|
| 2 grup, normal, paired | Paired t-test |
| 2 grup, non-normal | Wilcoxon signed-rank |
| > 2 grup, normal | One-way ANOVA + post-hoc |
| > 2 grup, non-normal | Kruskal-Wallis + post-hoc |
| 2 variabel kontinu | Pearson (normal) / Spearman (rank) |
### Failure Analysis as Contribution
Hipotesis yang ditolak adalah **temuan yang berharga**:
| Dataset | New (F1) | Baseline (F1) | p-value | Cohen's d |
|---------|---------|--------------|---------|-----------|
| DS-1 (small, clean) | 94.2±1.1 | 89.3±1.5 | <0.001 | **3.7** |
| DS-4 (medium, noisy) | 78.3±3.2 | 82.1±2.8 | 0.008 | **-1.3** |
| DS-5 (large, noisy) | 71.6±4.1 | 80.5±3.0 | <0.001 | **-2.5** |
**Insight:** Metode baru unggul di data bersih tapi gagal di data noisy asumsi Gaussian dilanggar **boundary condition** ditemukan hybrid approach direkomendasikan.
**Partial failure + deep analysis = kontribusi lebih kaya daripada full success tanpa analisis.**
### Limitation Types
| Jenis | Contoh |
|-------|--------|
| Internal validity | Confounders yang tidak dikontrol |
| External validity | Generalisasi ke domain lain |
| Construct validity | Metrik mengukur apa yang dimaksud? |
| Statistical limitation | Sample size, asumsi distribusi |
### Jebakan Kognitif
1. "Signifikan statistik = penting secara praktis" cek effect size
2. "Hipotesis tidak didukung cari sudut baru" p-hacking
3. "Kegagalan tidak perlu dilaporkan detail" missed insight
4. "Limitasi cukup disebutkan, tidak perlu dianalisis" kedalaman hilang
---
## Template A.14 — Analysis & Interpretation Report
```
ANALYSIS & INTERPRETATION
1. Statistik Deskriptif:
| Skenario | Mean | Std | Median | Min | Max | n |
|----------|------|-----|--------|-----|-----|---|
| | | | | | | |
2. Uji Hipotesis:
Uji yang digunakan : ____________________
Justifikasi : ____________________
Hasil: p = ____, effect size (d/r/η²) = ____
CI 95% : [____, ____]
3. Keputusan:
[ ] H₀ ditolak → H₁ diterima
[ ] H₀ tidak ditolak
4. Interpretasi:
Hubungan ke RQ : ____________________
Practical significance: ____________________
Perbandingan literatur: ____________________
5. Limitation:
| Jenis | Ancaman | Dampak | Mitigasi |
|-------|---------|--------|----------|
| | | | |
6. Failure Analysis (jika H₀ tidak ditolak):
Penyebab potensial : ____________________
Boundary condition : ____________________
Insight : ____________________
```
---
## Latihan 1 — Pemilihan Uji Statistik
Tentukan uji statistik yang tepat untuk eksperimen Anda.
| Pertanyaan | Jawaban |
|-----------|---------|
| Berapa grup yang dibandingkan? | *Contoh: 3 (BERT, LSTM, SVM)* |
| Apakah data berpasangan (paired)? | |
| Apakah distribusi normal? (uji normalitas) | |
| **Uji yang dipilih:** | |
| **Justifikasi:** | |
**Effect size yang akan dilaporkan:** [ ] Cohen's d / [ ] Eta-squared / [ ] Lainnya: ____
---
## Latihan 2 — Interpretasi Hasil
Gunakan data berikut (atau data riil Anda) untuk berlatih interpretasi.
**Data:**
| Model | Accuracy (mean ± std) | n |
|-------|----------------------|---|
| A | 89.2 ± 1.5 | 10 |
| B | 87.8 ± 2.1 | 10 |
p = 0.045, Cohen's d = 0.74, CI 95% = [0.03, 2.77]
| Aspek | Interpretasi |
|-------|-------------|
| Signifikansi statistik | *Contoh: p < 0.05 → signifikan pada α=0.05* |
| Effect size | *Contoh: d=0.74 → medium-to-large effect* |
| Practical significance | |
| Hubungan ke RQ | |
| Perbandingan literatur | |
---
## Latihan 3 — Failure Analysis
Latih kemampuan failure analysis: hipotesis TIDAK didukung. Apa yang bisa dipelajari?
**Skenario:** Metode baru Anda mendapat F1 = 83.2%, baseline = 84.7%. p = 0.12 (tidak signifikan).
| Pertanyaan | Jawaban |
|-----------|---------|
| Apakah ini "gagal"? | *Contoh: Bukan gagal total — hipotesis tidak terdukung adalah temuan yang valid dan bisa menjadi kontribusi.* |
| Kemungkinan penyebab? | *Contoh: Metode baru menambah kompleksitas komputasi (+40% waktu) tanpa peningkatan F1 yang cukup — overhead tidak sebanding.* |
| Boundary condition? | *Contoh: Metode ini hanya efektif ketika data ≥ 10.000 record; di dataset kecil (<1.000), baseline lebih stabil.* |
| Insight yang bisa diambil? | *Contoh: Ada trade-off ukuran data vs kompleksitas — rekomendasikan hybrid approach yang adaptif berdasarkan ukuran dataset.* |
| Apakah layak dilaporkan? Mengapa? | *Contoh: Ya — negative result + boundary condition analysis adalah kontribusi riset yang diakui komunitas (ex: ACL, SIGIR). Mencegah riset duplikasi yang berulang.* |
**Limitation terkait:**
| Jenis | Ancaman | Dampak |
|-------|---------|--------|
| *Contoh: Statistical* | *Contoh: Hanya 5 run per skenario* | *Power test rendah* |
| | | |
| | | |
---
## Refleksi
> Apakah "failure" dalam riset benar-benar gagal, atau justru kontribusi? Bagaimana failure analysis mengubah cara Anda melihat hasil negatif?
> ___________________________________________________
> ___________________________________________________