Классификация рака молочной железы используя методы машинного обучения
Аннотация
Статья посвящена исследованию методов классификации рака молочной железы с использованием современных технологий машинного обучения, таких как многослойный персептрон (MLP, Multi-Layer Perceptron), метод опорных векторов (SVM, Support Vector Machine), логистическая регрессия (Logistic Regression), (математическая регрессия), метод K-ближайших соседей (KNN, K-Nearest Neighbors), экстремальное повышение градиента (XGBoost, Extreme Gradient Boosting), случайный лес (RF, Random Forest), машина для повышения светового градиента (LightGBM, Light Gradient Boosting Machine), Наивный байесовский классификатор (Naive Bayes (GaussianNB)). В ходе работы были проанализированы различные показатели на наборе данных по диагностике рака молочной железы в Висконсине, доступные в системе машинного обучения UCI Repository. Результаты экспериментов демонстрируют высокую точность, обеспечивая надежное выявление рака молочной железы. Полученные данные подтверждают эффективность использования алгоритмов машинного обучения в области медицинской диагностики.
Ключевые слова:
рак молочной железы, классификация, нейронные сети, диагностика рака молочной железы, алгоритм машинного обученияБиблиографические ссылки
1 Ara S., Das A., & Dey A. (2021, April). Malignant and benign breast cancer classification using machine learning algorithms. In 2021 International Conference on Artificial Intelligence (ICAI) (pp. 97-101). IEEE.
2 Batool A., & Byun Y.C. (2023, August). Breast cancer classification using random forest algorithm. In Journal of Physics: Conference Series (Vol. 2559, No. 1, p. 012002). IOP Publishing.
3 Chen H., Wang N., Du X., Mei K., Zhou Y., & Cai G. (2023). Classification prediction of breast cancer based on machine learning. Computational intelligence and neuroscience, 2023(1), 6530719.
4 Desai M., & Shah M. (2021). An anatomization on breast cancer detection and diagnosis employing multi-layer perceptron neural network (MLP) and Convolutional neural network (CNN). Clinical eHealth, 4, 1-11.
5 Desiani A., Lestari A. A., Al-Ariq M., Amran A., & Andriani, Y. (2022). Comparison of support vector machine and k-nearest neighbors in breast cancer classification. Pattimura International Journal of Mathematics (PIJMath), 1(1), 33-42.
6 Jamil R., Dong M., Rashid J., Orken M., Pernebaykyzy Z. S., & Ragytovna M. K. (2024). High Accuracy Microcalcifications Detection of Breast Cancer Using Wiener LTI Tophat Model. IEEE Access.
7 Kanber B. M., Al Smadi A., Noaman N. F., Liu B., Gou S., & Alsmadi M. K. (2024). Lightgbm: A leading force in breast cancer diagnosis through machine learning and image processing. IEEE Access, 12, 39811-39832.
8 Lim T. S., Tay K. G., Huong A., & Lim X. Y. (2021). Breast cancer diagnosis system using hybrid support vector machine-artificial neural network. Int. J. Electr. Comput. Eng.(IJECE), 11(4), 3059.
9 Liew X. Y., Hameed N., & Clos J. (2021). An investigation of XGBoost-based algorithm for breast cancer classification. Machine Learning with Applications, 6, 100154.
10 Minnoor M., & Baths V. (2023). Diagnosis of breast cancer using random forests. Procedia Computer Science, 218, 429-437.
11 Orazayeva A., Tussupov J., Shangytbayeva G., Galymova A., Zhunissova U., Tergeussizova A., ... & Kenzhebayeva Z. (2024). Effective detection of breast pathology using machine learning methods. International Journal of Electrical & Computer Engineering (2088-8708), 14(5).
12 Strelcenia E., & Prakoonwit S. (2023). Effective feature engineering and classification of breast cancer diagnosis: a comparative study. BioMedInformatics, 3(3), 616-631.
13 World Health Organization. Data. Health data overview for the Republic of Kazakhstan. https://data.who.int/countries/398