16 Soal Tentang Machine Learning + Kunci Jawaban
Latihan Soal PG Bab Machine Learning
1. Salah satu keuntungan dari algoritma K-Means adalah:
A. Tidak memerlukan nilai awal yang disediakan oleh pengguna
B. Cocok untuk data dengan fitur kategorikal
C. Tidak terpengaruh oleh nilai pencilan (outlier)
D. Dapat menangani masalah klasifikasi multikelas secara langsung
Jawaban:
C. Tidak terpengaruh oleh nilai pencilan (outlier)
2. Model Machine Learning yang "dilatih" dengan data historis untuk memprediksi data masa depan adalah contoh dari:
A. Klasifikasi
B. Regresi
C. Unsupervised learning
D. Reinforcement learning
Jawaban:
B. Regresi
3. Metode pengoptimalan yang umum digunakan untuk melatih jaringan saraf tiruan adalah:
A. Stochastic Gradient Descent (SGD)
B. K-Means
C. Random Forest
D. Adaboost
Jawaban:
A. Stochastic Gradient Descent (SGD)
4. Metode pengklasifikasian yang menghitung probabilitas terjadinya suatu kejadian berdasarkan frekuensi kemunculan nilai dalam data latih adalah:
A. Naive Bayes
B. K-Nearest Neighbors (KNN)
C. Support Vector Machine (SVM)
D. Random Forest
Jawaban:
A. Naive Bayes'
5. Salah satu kelemahan dari algoritma Random Forest adalah:
A. Memerlukan waktu komputasi yang lama saat jumlah pohon (tree) yang digunakan besar
B. Rentan terhadap overfitting saat jumlah data pelatihan terbatas
C. Tidak dapat mengatasi data yang memiliki fitur kategorikal
D. Hanya cocok untuk data dengan fitur numerik
Jawaban:
A. Memerlukan waktu komputasi yang lama saat jumlah pohon (tree) yang digunakan besar
6. Metode yang digunakan untuk mengatasi masalah kebisingan (noise) dalam data adalah:
A. Data scaling
B. Data imputation
C. Data normalization
D. Data smoothing
Jawaban:
D. Data smoothing
7. Salah satu metode evaluasi yang digunakan untuk mengukur kualitas klastering adalah:
A. F1 score
B. Silhouette score
C. R-squared
D. AUC-ROC
Jawaban:
B. Silhouette score
8. Algoritma Machine Learning yang digunakan untuk prediksi harga saham adalah:
A. K-Means
B. Linear Regression
C. Decision Tree
D. Recurrent Neural Network (RNN)
Jawaban:
D. Recurrent Neural Network (RNN)
9. Salah satu teknik pengklasifikasian yang menggunakan sekumpulan pohon keputusan adalah:
A. Naive Bayes
B. Support Vector Machine (SVM)
C. Random Forest
D. K-Nearest Neighbors (KNN)
Jawaban:
C. Random Forest
10. Algoritma yang digunakan untuk mengurutkan data berdasarkan preferensi pengguna adalah:
A. Naive Bayes
B. Collaborative Filtering
C. Logistic Regression
D. Decision Tree
Jawaban:
B. Collaborative Filtering
11. Salah satu keuntungan dari menggunakan algoritma Support Vector Machine (SVM) adalah:
A. Tidak memerlukan banyak preprocessing pada data
B. Mampu menangani masalah klasifikasi multikelas secara langsung
C. Memiliki interpretabilitas yang tinggi
D. Efektif dalam mengatasi masalah overfitting
Jawaban:
D. Efektif dalam mengatasi masalah overfitting
12. Algoritma Machine Learning yang digunakan untuk klasifikasi berdasarkan aturan-aturan logika adalah:
A. Naive Bayes
B. Decision Tree
C. K-Nearest Neighbors (KNN)
D. Linear Regression
Jawaban:
B. Decision Tree
13. Salah satu keuntungan dari algoritma Linear Regression adalah:
A. Cocok untuk data dengan banyak fitur dan dimensi tinggi
B. Tidak terpengaruh oleh nilai pencilan (outlier)
C. Memiliki interpretabilitas yang tinggi
D. Mampu menangani masalah klasifikasi multikelas secara langsung
Jawaban:
C. Memiliki interpretabilitas yang tinggi
14. Algoritma Machine Learning yang digunakan untuk klasifikasi gambar adalah:
A. Naive Bayes
B. K-Means
C. Convolutional Neural Network (CNN)
D. Random Forest
Jawaban:
C. Convolutional Neural Network (CNN)
15. Salah satu metode yang digunakan untuk meningkatkan generalisasi model Machine Learning adalah:
A. Data augmentation
B. Feature selection
C. Regularisasi
D. Semua jawaban benar
Jawaban:
D. Semua jawaban benar
16. Salah satu teknik yang digunakan untuk mengevaluasi model Machine Learning dalam tugas regresi adalah:
A. R-squared
B. Precision
C. F1 score
D. AUC-ROC
Jawaban:
A. R-squared