- slide/: 16 Marp slide files with inline UPB CSS theme (slide-01 through slide-16, covering all RTI-20252 topics) - slide/theme/: upb.css canonical theme + logo-upb.png - docs/AI-BOOK-PROMPT-TEMPLATE.md: RTI-20252 book authoring prompt
41 KiB
| marp | paginate | header | footer |
|---|---|---|---|
| true | true | RTI — Riset Teknologi Informasi | Universitas Putra Bangsa Kebumen | Helmi Bahar Alim, S.Kom., M.Kom. | 2026 |
Bab 4 — RQ, Contribution & Hypothesis
Merancang Pertanyaan Riset dan Hipotesis yang Dapat Diuji
Pertemuan 4 (M4) | Sub-CPMK 1.4 | CPMK01 | CPL03
Fase: Thinking (M1–M4) · Bagian I: Foundation
Universitas Putra Bangsa | Fak. Sains & Teknologi · Prodi Teknik Informatika
Agenda Pertemuan 4
- Bridge dari Bab 3 — dari gap ke pertanyaan
- RQ Formation Model — pipeline RQ yang valid
- Tiga jenis RQ: Comparison, Improvement, Exploratory
- Kriteria RQ yang baik: SMART + Testable
- Contribution statement — tiga jenis kontribusi
- Hipotesis: H0 dan H1, syarat apa yang harus dipenuhi
- RQ → Variable → Metric → Data → Analysis (chain of operationalization)
- Cognitive Traps & Studi Kasus
- Output Praktis: RQ + Contribution + H0/H1
Capaian Pembelajaran
Setelah pertemuan ini, mahasiswa mampu:
- Merumuskan Research Question (RQ) yang tajam, terukur, dan dapat diuji
- Membedakan 3 jenis RQ: Comparison, Improvement, Exploratory
- Menyusun contribution statement yang eksplisit (improvement/comparison/novel)
- Merumuskan hipotesis H0/H1 yang testable secara statistik
- Memetakan RQ → Variable → Metric → Data → Analysis
Sub-CPMK 1.4 → Merancang RQ, hypothesis, dan contribution (CPL03)
Bridge dari Bab 3
Di Bab 3, Anda telah:
- Menavigasi literatur hingga menemukan research gap
- Memvalidasi gap (Performance / Method / Data / Context)
- Menetapkan baseline yang valid sebagai titik pembanding
Pertanyaan berikutnya:
Dari gap yang teridentifikasi, pertanyaan apa tepatnya yang akan Anda jawab?
Gap adalah masalah yang belum terjawab. RQ adalah rumusan presisi dari pertanyaan yang akan dijawab melalui eksperimen. Tanpa RQ yang tajam, eksperimen tidak punya arah.
RQ Formation Model
Pipeline dari Problem hingga RQ yang siap dieksperimenkan
Problem → Research Gap → Research Question → Hypothesis → Experiment Design
| Tahap | Output | Ciri Keberhasilan |
|---|---|---|
| Problem | Masalah yang teridentifikasi | Spesifik, terukur (dari Bab 2) |
| Research Gap | Celah di literatur | Jenis gap teridentifikasi (dari Bab 3) |
| Research Question | Pertanyaan eksplisit | Bisa dijawab melalui eksperimen |
| Hypothesis | H0 + H1 | Falsifiable, testable dengan statistik |
| Experiment Design | Blueprint eksperimen | Variabel terkontrol, baseline jelas |
RQ bukan judul dalam bentuk tanya. RQ adalah instrumen yang mengarahkan seluruh desain eksperimen.
Tiga Jenis Research Question
| Jenis RQ | Pertanyaan Template | Cocok Ketika |
|---|---|---|
| Comparison | "Seberapa besar perbedaan metode A vs B pada [metrik] untuk [konteks]?" | Ada dua+ pendekatan yang ingin dibandingkan |
| Improvement | "Sejauh mana modifikasi [X] meningkatkan [metrik] dibandingkan baseline?" | Ada celah performa yang ingin diisi |
| Exploratory | "Faktor apa yang paling berpengaruh terhadap [variabel] dalam [konteks]?" | Fenomena baru yang mekanismenya belum jelas |
Contoh:
- Comparison: "Seberapa besar perbedaan akurasi BERT vs IndoBERT dalam klasifikasi sentimen Bahasa Indonesia pada domain e-commerce?"
- Improvement: "Sejauh mana penambahan attention mechanism meningkatkan Recall pada model NER Bahasa Indonesia dibandingkan BiLSTM-CRF baseline?"
- Exploratory: "Faktor apa yang paling berpengaruh terhadap latensi inferensi model transformer pada perangkat edge (ARM Cortex-M7)?"
Kriteria RQ yang Baik
SMART + Testable:
| Kriteria | Penjelasan | Contoh Gagal | Contoh Benar |
|---|---|---|---|
| Specific | Satu masalah, satu konteks | "Bagaimana ML bekerja dalam bisnis?" | "Bagaimana XGBoost vs RF dalam fraud detection transaksi kartu kredit?" |
| Measurable | Ada metrik kuantitatif | "Apakah sistem lebih baik?" | "Apakah F1-score meningkat ≥ 5%?" |
| Achievable | Bisa dijawab dengan sumber daya yang ada | RQ butuh 10 tahun data | RQ bisa dijawab dalam 1 semester |
| Relevant | Terhubung ke gap yang teridentifikasi | RQ tidak ada gap-nya | RQ mengisi Method Gap yang jelas |
| Testable | Bisa diuji secara statistik | "Apakah AI itu berguna?" | "Apakah perbedaan signifikan (p<0.05)?" |
Contribution Statement — Tiga Jenis
Setiap riset harus memiliki contribution claim yang eksplisit.
| Jenis Kontribusi | Definisi | Contoh Kalimat |
|---|---|---|
| Improvement | Meningkatkan performa metode yang sudah ada | "Riset ini meningkatkan Recall deteksi fraud dari 72% (baseline XGBoost) menjadi 89% melalui kombinasi SMOTE + cost-sensitive learning" |
| Comparison | Menyediakan perbandingan yang belum ada di konteks tertentu | "Riset ini menyediakan perbandingan komprehensif pertama antara 5 algoritma ML pada dataset transaksi perbankan syariah Indonesia" |
| Novel Approach | Metode atau kombinasi baru yang belum pernah digunakan | "Riset ini mengusulkan arsitektur hybrid CNN-Transformer dengan attention pruning untuk inferensi on-device dengan parameter 40% lebih sedikit" |
Klaim "pertama di dunia" membutuhkan bukti dari systematic literature review yang ketat. Gunakan dengan hati-hati.
Hipotesis: H0 dan H1
H0 (Null Hypothesis): tidak ada perbedaan / pengaruh signifikan antara kondisi yang dibandingkan
H1 (Alternative Hypothesis): ada perbedaan / pengaruh yang signifikan
Syarat hipotesis yang valid:
- Falsifiable — bisa dibuktikan salah dengan data
- Testable — bisa diuji dengan uji statistik yang tersedia
- Specific — menyebutkan variabel, arah, dan ukuran efek yang diharapkan
- Grounded — berdasarkan teori atau temuan literatur sebelumnya
Contoh pair H0/H1:
H0: Penambahan attention mechanism pada BiLSTM tidak meningkatkan F1-score NER secara signifikan (p ≥ 0.05) dibandingkan BiLSTM baseline.
H1: Penambahan attention mechanism pada BiLSTM meningkatkan F1-score NER secara signifikan (p < 0.05) dibandingkan BiLSTM baseline.
RQ → Variable → Metric → Data → Analysis
Rantai operasionalisasi yang tidak boleh putus
RQ → Independent Var → Dependent Var → Metric → Data Type → Statistical Test
Contoh lengkap:
| Elemen | Nilai |
|---|---|
| RQ | Sejauh mana SMOTE meningkatkan Recall dalam fraud detection? |
| Independent Variable | Teknik resampling: tanpa SMOTE vs dengan SMOTE |
| Dependent Variable | Kemampuan deteksi fraud |
| Metric | Recall, F2-score, AUC-ROC |
| Data Type | Ratio scale |
| Statistical Test | Paired t-test / Wilcoxon signed-rank |
Jika satu elemen tidak terhubung ke elemen lainnya → construct validity rusak.
Cognitive Traps
Bab 4 — RQ & Hypothesis
Cognitive Traps — Bab 4
"RQ = judul penelitian dalam bentuk kalimat tanya" Judul bersifat deskriptif. RQ bersifat operational — ia mendefinisikan variabel, konteks, dan ukuran keberhasilan. "Bagaimana sistem deteksi fraud berbasis ML?" bukan RQ — tidak ada yang bisa dieksperimenkan.
"RQ tidak perlu metric — yang penting pertanyaannya jelas" Tanpa metrik, tidak ada cara mengukur apakah RQ berhasil dijawab. RQ harus mengandung atau secara implisit mengarah ke ukuran kuantitatif.
"RQ bisa dijawab tanpa eksperimen" Jika RQ bisa dijawab hanya dengan membaca buku atau teori, itu bukan RQ penelitian — itu pertanyaan studi literatur. RQ harus membutuhkan data empiris.
Studi Kasus 1 — RQ Terlalu Umum (Basic)
RQ awal: "Bagaimana deep learning dapat meningkatkan akurasi klasifikasi teks?"
Masalah:
- Terlalu luas: "deep learning" (ratusan arsitektur), "teks" (semua domain), "akurasi" (metrik tunggal + imbalance risk)
- Tidak ada konteks spesifik
- Tidak ada baseline yang jelas
- Tidak bisa diuji dalam satu semester
RQ yang diperbaiki: "Sejauh mana fine-tuning IndoBERT pada dataset review produk e-commerce berbahasa Indonesia meningkatkan F1-score klasifikasi sentimen dibandingkan baseline IndoBERT tanpa fine-tuning, dengan distribusi kelas yang seimbang?"
Perbaikan: domain (e-commerce Indonesia), model spesifik (IndoBERT), metrik (F1-score), baseline (IndoBERT vanilla), kontrol (distribusi kelas).
Studi Kasus 2 — RQ Tanpa Baseline (Advanced)
Situasi: Peneliti ingin meneliti "efektivitas GAN dalam augmentasi data medis." RQ: "Apakah GAN dapat menghasilkan data medis sintetis yang berguna?"
Masalah:
- Tidak ada baseline pembanding
- "Berguna" tidak terukur
- Tidak ada metrik kualitas data sintetis yang dispesifikkan
- Tidak ada uji hipotesis yang bisa dirancang
RQ yang diperbaiki: "Sejauh mana augmentasi data menggunakan StyleGAN2 meningkatkan F1-score klasifikasi pneumonia pada chest X-ray dibandingkan baseline tanpa augmentasi dan augmentasi tradisional (flip+rotation+brightness), diukur pada dataset ChestX-ray14 dengan split 70/15/15?"
Perbaikan: Metode GAN spesifik, 2 baseline (tanpa augmentasi + augmentasi tradisional), metrik jelas, dataset dan split terdefinisi.
Ringkasan Pertemuan 4
| Konsep | Inti |
|---|---|
| RQ Formation | Problem → Gap → RQ → Hypothesis → Experiment Design |
| 3 Jenis RQ | Comparison · Improvement · Exploratory |
| Kriteria RQ | SMART + Testable + ada metrik kuantitatif |
| Contribution | Improvement / Comparison / Novel (pilih satu, klaim eksplisit) |
| H0/H1 | Null vs Alternative, falsifiable, testable, specific |
| Operasionalisasi | RQ → IndepVar → DepVar → Metric → DataType → StatTest |
Final Statement & Output Praktis
Output Praktis M4
Susun 3 dokumen akhir Fase Thinking:
- Research Question — 1 RQ yang memenuhi SMART+Testable, sesuai jenis (comparison/improvement/exploratory)
- Contribution Statement — 1–2 kalimat eksplisit tentang kontribusi riset Anda
- Hipotesis — H0 + H1 yang falsifiable, disertai StatTest yang direncanakan
Ketiga dokumen ini + Problem Statement (M2) + Gap Statement (M3) = fondasi proposal riset Anda.
Referensi Utama — Bab 4
-
Creswell, J. W., & Creswell, J. D. (2018). Research design: Qualitative, quantitative, and mixed methods approaches (5th ed.). SAGE Publications.
-
Kitchenham, B. A., Pfleeger, S. L., Pickard, L. M., Jones, P. W., Hoaglin, D. C., El Emam, K., & Rosenberg, J. (2002). Preliminary guidelines for empirical research in software engineering. IEEE Transactions on Software Engineering, 28(8), 721–734.
-
Runeson, P., & Höst, M. (2009). Guidelines for conducting and reporting case study research in software engineering. Empirical Software Engineering, 14(2), 131–164.
-
Wohlin, C., Runeson, P., Höst, M., Ohlsson, M. C., Regnell, B., & Wesslén, A. (2012). Experimentation in software engineering. Springer.