Setiap algoritma memiliki prinsip kerja yang berbeda dan cocok untuk jenis masalah klasifikasi tertentu. Beberapa algoritma lebih sederhana dan mudah diinterpretasikan seperti Regresi Logistik, sementara yang lain seperti Deep Learning membutuhkan lebih banyak data dan sumber daya komputasi yang besar. Pilihan algoritma klasifikasi tergantung pada karakteristik data, ukuran sampel, interpretabilitas model, dan ketersediaan sumber daya yang ada.
Penting untuk melakukan eksperimen dan evaluasi algoritma-algoritma ini pada dataset yang relevan untuk menentukan algoritma mana yang memberikan kinerja terbaik dalam konteks masalah klasifikasi yang dihadapi.
Berikut adalah beberapa algoritma klasifikasi populer dalam bidang pembelajaran mesin:
- Regresi Logistik (Logistic Regression)
- Naive Bayes
- K-Nearest Neighbors (K-NN)
- Decision Tree (Pohon Keputusan)
- Random Forest
- Support Vector Machines (SVM)
- Artificial Neural Networks (ANN)
- Gradient Boosting (misalnya, Gradient Boosting Machine (GBM), XGBoost, LightGBM)
- AdaBoost
- Linear Discriminant Analysis (LDA)
- Quadratic Discriminant Analysis (QDA)
- Extreme Gradient Boosting (XGBoost)
- CatBoost
- Neural Network - Deep Learning (misalnya, Convolutional Neural Networks (CNN), Recurrent Neural Networks (RNN))
- Support Vector Classifier (SVC)
- Gaussian Naive Bayes
- Multinomial Naive Bayes
- Bernoulli Naive Bayes
- Hidden Markov Models (HMM)
- Conditional Random Fields (CRF)
- Ensemble Methods (misalnya, Voting Classifier, Stacking Classifier)
- Genetic Algorithms (GA)
- K-Means Clustering (dapat digunakan untuk klasifikasi)
- Principal Component Analysis (PCA) + Algoritma klasifikasi
- Self-Organizing Maps (SOM)
- Support Vector Regression (SVR) - dapat digunakan untuk masalah regresi
- Perceptron
- Elastic Net
- Ridge Regression
- Lasso Regression