Tạp chí đã xuất bản
2004
ISSN
ISSN 2615-9813
ISSN (số cũ) 1859-3682

SỐ 216 | Tháng 3/2024

Xây dựng mô hình dự báo rủi ro vỡ nợ bằng các mô hình học máy: Nghiên cứu thực nghiệm trên các doanh nghiệp Việt Nam

Nguyễn Minh Nhật, Trần Kim Long, Lê Hoàng Anh

Tóm tắt:

Trong hoạt động quản lý rủi ro tín dụng, dự báo rủi ro vỡ nợ (RRVN) là một công việc quan trọng đối với các tổ chức tài chính. Xác định RRVN giúp chủ nợ có thể sàng lọc khách hàng vay, ước tính lãi suất, xác lập các điều kiện vay vốn và quản lý danh mục tín dụng. Xác suất vỡ nợ cũng được nhà đầu tư sử dụng để theo dõi chất lượng tín dụng của các trái phiếu, định giá và thiết lập danh mục đầu tư. Trong nghiên cứu này, nhóm tác giả đã sử dụng các mô hình máy học dựa trên thuật toán cây quyết định để dự báo RRVN của các doanh nghiệp tại Việt Nam giai đoạn 2009–2020. Kết quả cho thấy mô hình Random Forest và Gradient Boosting là hai mô hình có kết quả vượt trội so với mô hình Logistic trên tất cả các tiêu chí đánh giá như Confusion Matrix AUC, tỷ lệ Accuracy, tỷ lệ Precision, tỷ lệ Recall và Điểm số F1. Trong đó, mô hình Random Forest có xu hướng vượt trội hơn so với mô hình Gradient Boosting trên các chỉ tiêu đánh giá. Hơn nữa, kết quả của mô hình cũng gợi ý những biến dự báo quan trọng trong việc xây dựng mô hình dự báo RRVN.

 

Tài liệu tham khảo:

  1. Abellán, J., & Castellano, J. G. (2017). A comparative study on base classifiers in ensemble methods for credit scoring. Expert Systems with Applications, 73, 1-10.
  2. Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The Journal of Finance, 23(4), 589-609.
  3. Barboza, F., Kimura, H., & Altman, E. (2017). Machine learning models and bankruptcy prediction. Expert systems with applications, 83, 405-417.
  4. Beaver, W. H. (1966). Financial ratios as predictors of failure. Journal of accounting research, 71-111.
  5. Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.
  6. Chakraborty, C., & Joseph, A. (2017). Machine learning at central banks.
  7. Fantazzini, D., & Figini, S. (2009). Random survival forests models for SME credit risk measurement. Methodology and computing in applied probability, 11, 29-45.
  8. Friedman, J. H. (2001). Greedy function approximation: a gradient boosting machine. Annals of statistics, 1189-1232.
  9. Fuster, A., Goldsmith-Pinkham, P., Ramadorai, T., & Walther, A. (2018). Predictably unequal. The Effects of Machine Learning on Credit Markets. Revise & Resubmit in Journal of Finance.
  10. Harris, C. R., Millman, K. J., Van Der Walt, S. J., Gommers, R., Virtanen, P., Cournapeau, D., . . . Smith, N. J. (2020). Array programming with NumPy. Nature, 585(7825), 357-362.
  11. Kruppa, J., Schwarz, A., Arminger, G., & Ziegler, A. (2013). Consumer credit risk: Individual probability estimates using machine learning. Expert systems with applications, 40(13), 5125-5131.
  12. McKinney, W. (2010). Data structures for statistical computing in python. Paper presented at the Proceedings of the 9th Python in Science Conference.
  13. Ohlson, J. A. (1980). Financial ratios and the probabilistic prediction of bankruptcy. Journal of accounting research, 109-131.
  14. Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., . . . Dubourg, V. (2011). Scikit-learn: Machine learning in Python. the Journal of machine Learning research, 12, 2825-2830.
  15. Waskom, M., Botvinnik, O., O'Kane, D., Hobson, P., Lukauskas, S., Gemperline, D. C., . . . Warmenhoven, J. (2017). Mwaskom/Seaborn: V0. 8.1 (September 2017). Zenodo.


Developing Default Prediction Models Using Machine Learning: An Empirical Study of Vietnamese Enterprises

Abstract:

Forecasting bankruptcy risk is a critical task for financial institutions in the realm of credit risk management. Identifying bankruptcy risk allows creditors to screen loan applicants, estimate interest rates, establish lending conditions, and manage credit portfolios. Investors also use bankruptcy probabilities to monitor the credit quality of bonds, for pricing, and to set up investment portfolios. In this study, the authors employed machine learning models based on decision tree algorithms to predict the bankruptcy risk of companies in Vietnam from 2009 to 2020. The results indicate that the Random Forest and Gradient Boosting models significantly outperform the Logistic regression model across all evaluation metrics, such as Confusion Matrix AUC, Accuracy ratio, Precision ratio, Recall ratio, and F1 Score. Among them, the Random Forest model tends to perform better than the Gradient Boosting model on these evaluation criteria. Moreover, the results of the model also suggest important predictive variables in constructing a bankruptcy risk prediction model.