riset-teknologi-informasi/slide/slide-04-rq-hypothesis.md
hb_alim e3e1e8db41 feat: add slide deck and book prompt template
- slide/: 16 Marp slide files with inline UPB CSS theme
  (slide-01 through slide-16, covering all RTI-20252 topics)
- slide/theme/: upb.css canonical theme + logo-upb.png
- docs/AI-BOOK-PROMPT-TEMPLATE.md: RTI-20252 book authoring prompt
2026-04-13 15:04:45 +07:00

41 KiB
Raw Permalink Blame History

marp paginate header footer
true true RTI — Riset Teknologi Informasi | Universitas Putra Bangsa Kebumen Helmi Bahar Alim, S.Kom., M.Kom. | 2026

Bab 4 — RQ, Contribution & Hypothesis

Merancang Pertanyaan Riset dan Hipotesis yang Dapat Diuji

Pertemuan 4 (M4)  |  Sub-CPMK 1.4  |  CPMK01  |  CPL03

Fase: Thinking (M1M4)  ·  Bagian I: Foundation

Universitas Putra Bangsa  |  Fak. Sains & Teknologi  ·  Prodi Teknik Informatika


Agenda Pertemuan 4

  1. Bridge dari Bab 3 — dari gap ke pertanyaan
  2. RQ Formation Model — pipeline RQ yang valid
  3. Tiga jenis RQ: Comparison, Improvement, Exploratory
  4. Kriteria RQ yang baik: SMART + Testable
  5. Contribution statement — tiga jenis kontribusi
  6. Hipotesis: H0 dan H1, syarat apa yang harus dipenuhi
  7. RQ → Variable → Metric → Data → Analysis (chain of operationalization)
  8. Cognitive Traps & Studi Kasus
  9. Output Praktis: RQ + Contribution + H0/H1

Capaian Pembelajaran

Setelah pertemuan ini, mahasiswa mampu:

  • Merumuskan Research Question (RQ) yang tajam, terukur, dan dapat diuji
  • Membedakan 3 jenis RQ: Comparison, Improvement, Exploratory
  • Menyusun contribution statement yang eksplisit (improvement/comparison/novel)
  • Merumuskan hipotesis H0/H1 yang testable secara statistik
  • Memetakan RQ → Variable → Metric → Data → Analysis

Sub-CPMK 1.4 → Merancang RQ, hypothesis, dan contribution (CPL03)


Bridge dari Bab 3

Di Bab 3, Anda telah:

  • Menavigasi literatur hingga menemukan research gap
  • Memvalidasi gap (Performance / Method / Data / Context)
  • Menetapkan baseline yang valid sebagai titik pembanding

Pertanyaan berikutnya:

Dari gap yang teridentifikasi, pertanyaan apa tepatnya yang akan Anda jawab?

Gap adalah masalah yang belum terjawab. RQ adalah rumusan presisi dari pertanyaan yang akan dijawab melalui eksperimen. Tanpa RQ yang tajam, eksperimen tidak punya arah.


RQ Formation Model

Pipeline dari Problem hingga RQ yang siap dieksperimenkan

Problem → Research Gap → Research Question → Hypothesis → Experiment Design

Tahap Output Ciri Keberhasilan
Problem Masalah yang teridentifikasi Spesifik, terukur (dari Bab 2)
Research Gap Celah di literatur Jenis gap teridentifikasi (dari Bab 3)
Research Question Pertanyaan eksplisit Bisa dijawab melalui eksperimen
Hypothesis H0 + H1 Falsifiable, testable dengan statistik
Experiment Design Blueprint eksperimen Variabel terkontrol, baseline jelas

RQ bukan judul dalam bentuk tanya. RQ adalah instrumen yang mengarahkan seluruh desain eksperimen.


Tiga Jenis Research Question

Jenis RQ Pertanyaan Template Cocok Ketika
Comparison "Seberapa besar perbedaan metode A vs B pada [metrik] untuk [konteks]?" Ada dua+ pendekatan yang ingin dibandingkan
Improvement "Sejauh mana modifikasi [X] meningkatkan [metrik] dibandingkan baseline?" Ada celah performa yang ingin diisi
Exploratory "Faktor apa yang paling berpengaruh terhadap [variabel] dalam [konteks]?" Fenomena baru yang mekanismenya belum jelas

Contoh:

  • Comparison: "Seberapa besar perbedaan akurasi BERT vs IndoBERT dalam klasifikasi sentimen Bahasa Indonesia pada domain e-commerce?"
  • Improvement: "Sejauh mana penambahan attention mechanism meningkatkan Recall pada model NER Bahasa Indonesia dibandingkan BiLSTM-CRF baseline?"
  • Exploratory: "Faktor apa yang paling berpengaruh terhadap latensi inferensi model transformer pada perangkat edge (ARM Cortex-M7)?"

Kriteria RQ yang Baik

SMART + Testable:

Kriteria Penjelasan Contoh Gagal Contoh Benar
Specific Satu masalah, satu konteks "Bagaimana ML bekerja dalam bisnis?" "Bagaimana XGBoost vs RF dalam fraud detection transaksi kartu kredit?"
Measurable Ada metrik kuantitatif "Apakah sistem lebih baik?" "Apakah F1-score meningkat ≥ 5%?"
Achievable Bisa dijawab dengan sumber daya yang ada RQ butuh 10 tahun data RQ bisa dijawab dalam 1 semester
Relevant Terhubung ke gap yang teridentifikasi RQ tidak ada gap-nya RQ mengisi Method Gap yang jelas
Testable Bisa diuji secara statistik "Apakah AI itu berguna?" "Apakah perbedaan signifikan (p<0.05)?"

Contribution Statement — Tiga Jenis

Setiap riset harus memiliki contribution claim yang eksplisit.

Jenis Kontribusi Definisi Contoh Kalimat
Improvement Meningkatkan performa metode yang sudah ada "Riset ini meningkatkan Recall deteksi fraud dari 72% (baseline XGBoost) menjadi 89% melalui kombinasi SMOTE + cost-sensitive learning"
Comparison Menyediakan perbandingan yang belum ada di konteks tertentu "Riset ini menyediakan perbandingan komprehensif pertama antara 5 algoritma ML pada dataset transaksi perbankan syariah Indonesia"
Novel Approach Metode atau kombinasi baru yang belum pernah digunakan "Riset ini mengusulkan arsitektur hybrid CNN-Transformer dengan attention pruning untuk inferensi on-device dengan parameter 40% lebih sedikit"

Klaim "pertama di dunia" membutuhkan bukti dari systematic literature review yang ketat. Gunakan dengan hati-hati.


Hipotesis: H0 dan H1

H0 (Null Hypothesis): tidak ada perbedaan / pengaruh signifikan antara kondisi yang dibandingkan

H1 (Alternative Hypothesis): ada perbedaan / pengaruh yang signifikan

Syarat hipotesis yang valid:

  1. Falsifiable — bisa dibuktikan salah dengan data
  2. Testable — bisa diuji dengan uji statistik yang tersedia
  3. Specific — menyebutkan variabel, arah, dan ukuran efek yang diharapkan
  4. Grounded — berdasarkan teori atau temuan literatur sebelumnya

Contoh pair H0/H1:

H0: Penambahan attention mechanism pada BiLSTM tidak meningkatkan F1-score NER secara signifikan (p ≥ 0.05) dibandingkan BiLSTM baseline.

H1: Penambahan attention mechanism pada BiLSTM meningkatkan F1-score NER secara signifikan (p < 0.05) dibandingkan BiLSTM baseline.


RQ → Variable → Metric → Data → Analysis

Rantai operasionalisasi yang tidak boleh putus

RQ → Independent Var → Dependent Var → Metric → Data Type → Statistical Test

Contoh lengkap:

Elemen Nilai
RQ Sejauh mana SMOTE meningkatkan Recall dalam fraud detection?
Independent Variable Teknik resampling: tanpa SMOTE vs dengan SMOTE
Dependent Variable Kemampuan deteksi fraud
Metric Recall, F2-score, AUC-ROC
Data Type Ratio scale
Statistical Test Paired t-test / Wilcoxon signed-rank

Jika satu elemen tidak terhubung ke elemen lainnya → construct validity rusak.


Cognitive Traps

Bab 4 — RQ & Hypothesis


Cognitive Traps — Bab 4

"RQ = judul penelitian dalam bentuk kalimat tanya" Judul bersifat deskriptif. RQ bersifat operational — ia mendefinisikan variabel, konteks, dan ukuran keberhasilan. "Bagaimana sistem deteksi fraud berbasis ML?" bukan RQ — tidak ada yang bisa dieksperimenkan.

"RQ tidak perlu metric — yang penting pertanyaannya jelas" Tanpa metrik, tidak ada cara mengukur apakah RQ berhasil dijawab. RQ harus mengandung atau secara implisit mengarah ke ukuran kuantitatif.

"RQ bisa dijawab tanpa eksperimen" Jika RQ bisa dijawab hanya dengan membaca buku atau teori, itu bukan RQ penelitian — itu pertanyaan studi literatur. RQ harus membutuhkan data empiris.


Studi Kasus 1 — RQ Terlalu Umum (Basic)

RQ awal: "Bagaimana deep learning dapat meningkatkan akurasi klasifikasi teks?"

Masalah:

  • Terlalu luas: "deep learning" (ratusan arsitektur), "teks" (semua domain), "akurasi" (metrik tunggal + imbalance risk)
  • Tidak ada konteks spesifik
  • Tidak ada baseline yang jelas
  • Tidak bisa diuji dalam satu semester

RQ yang diperbaiki: "Sejauh mana fine-tuning IndoBERT pada dataset review produk e-commerce berbahasa Indonesia meningkatkan F1-score klasifikasi sentimen dibandingkan baseline IndoBERT tanpa fine-tuning, dengan distribusi kelas yang seimbang?"

Perbaikan: domain (e-commerce Indonesia), model spesifik (IndoBERT), metrik (F1-score), baseline (IndoBERT vanilla), kontrol (distribusi kelas).


Studi Kasus 2 — RQ Tanpa Baseline (Advanced)

Situasi: Peneliti ingin meneliti "efektivitas GAN dalam augmentasi data medis." RQ: "Apakah GAN dapat menghasilkan data medis sintetis yang berguna?"

Masalah:

  • Tidak ada baseline pembanding
  • "Berguna" tidak terukur
  • Tidak ada metrik kualitas data sintetis yang dispesifikkan
  • Tidak ada uji hipotesis yang bisa dirancang

RQ yang diperbaiki: "Sejauh mana augmentasi data menggunakan StyleGAN2 meningkatkan F1-score klasifikasi pneumonia pada chest X-ray dibandingkan baseline tanpa augmentasi dan augmentasi tradisional (flip+rotation+brightness), diukur pada dataset ChestX-ray14 dengan split 70/15/15?"

Perbaikan: Metode GAN spesifik, 2 baseline (tanpa augmentasi + augmentasi tradisional), metrik jelas, dataset dan split terdefinisi.


Ringkasan Pertemuan 4

Konsep Inti
RQ Formation Problem → Gap → RQ → Hypothesis → Experiment Design
3 Jenis RQ Comparison · Improvement · Exploratory
Kriteria RQ SMART + Testable + ada metrik kuantitatif
Contribution Improvement / Comparison / Novel (pilih satu, klaim eksplisit)
H0/H1 Null vs Alternative, falsifiable, testable, specific
Operasionalisasi RQ → IndepVar → DepVar → Metric → DataType → StatTest

Final Statement & Output Praktis

"Research Question bukan sekadar pertanyaan, tetapi blueprint dari eksperimen yang akan dilakukan."

Output Praktis M4

Susun 3 dokumen akhir Fase Thinking:

  1. Research Question — 1 RQ yang memenuhi SMART+Testable, sesuai jenis (comparison/improvement/exploratory)
  2. Contribution Statement — 12 kalimat eksplisit tentang kontribusi riset Anda
  3. Hipotesis — H0 + H1 yang falsifiable, disertai StatTest yang direncanakan

Ketiga dokumen ini + Problem Statement (M2) + Gap Statement (M3) = fondasi proposal riset Anda.


Referensi Utama — Bab 4

  • Creswell, J. W., & Creswell, J. D. (2018). Research design: Qualitative, quantitative, and mixed methods approaches (5th ed.). SAGE Publications.

  • Kitchenham, B. A., Pfleeger, S. L., Pickard, L. M., Jones, P. W., Hoaglin, D. C., El Emam, K., & Rosenberg, J. (2002). Preliminary guidelines for empirical research in software engineering. IEEE Transactions on Software Engineering, 28(8), 721734.

  • Runeson, P., & Höst, M. (2009). Guidelines for conducting and reporting case study research in software engineering. Empirical Software Engineering, 14(2), 131164.

  • Wohlin, C., Runeson, P., Höst, M., Ohlsson, M. C., Regnell, B., & Wesslén, A. (2012). Experimentation in software engineering. Springer.