پیش‌بینی منحنی بازده ایران: ترکیب مدل عاملی با رویکرد یادگیری ماشین

نوع مقاله : علمی - پژوهشی

نویسندگان

1 گروه مالی و بانکداری، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی(ره)، تهران، ایران،

2 گروه مالی و بانکداری، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی(ره)، تهران، ایران.

3 گروه رایانه، دانشکده آمار، ریاضی و رایانه، دانشگاه علامه طباطبائی(ره)، تهران، ایران.

چکیده

هدف: منحنی بازده یکی از ابزارهای کلیدی در تحلیل‌های اقتصادی به‌شمار می‌رود که نقش مهمی در تفسیر انتظارات بازار نسبت به سیاست‌های پولی، وضعیت اقتصادی و تورم در بازه‌های زمانی مختلف ایفا می‌کند. این منحنی همچنین در حوزه‌هایی چون سیاست‌گذاری مالی، مدل‌سازی کسب‌وکار نهادهای مالی و تصمیم‌گیری‌های سرمایه‌گذاری مانند ارزش‌گذاری دارایی‌ها و مدیریت ریسک کاربرد فراوانی دارد. با وجود اهمیت بالای موضوع، پیش‌بینی و تحلیل منحنی بازده در ایران کمتر مورد توجه قرار گرفته است درحالیکه اقتصاد ایران با چالش‌هایی مانند تورم مزمن، نوسانات ارزی، تحریم‌ها و وابستگی به درآمدهای نفتی مواجه است. هدف این پژوهش، پیش‌بینی منحنی بازده اوراق دولتی بدون ریسک در ایران است. در این راستا، پیش‌بینی‌ با توجه به دو بعد زمان و سررسید انجام شد به طوریکه ضمن بررسی رفتار بازده‌ اوراق با سررسید مختلف در هر زمان، روند تغییرات هر سررسید در طول زمان نیز تحلیل شد.

روش: با وجود توسعه روش‌های مختلف برای پیش‌بینی منحنی بازده، مدل عاملی نلسون-سیگل پویا به‌دلیل تفسیرپذیری بالا، کاهش ابعاد و توانایی خلاصه‌سازی منحنی در سه عامل کلیدی سطح، شیب و انحنا، به‌عنوان چارچوب پایه برآورد انتخاب شد. این عوامل به‌دلیل دلالت‌های اقتصادی و مالی مشخص، نقشی مهم در تصمیم‌گیری‌های سیاستی و راهبردی ایفا می‌کنند. در این پژوهش، با استفاده از داده‌های اسناد خزانه اسلامی در بازار سرمایه ایران، تلاش شد تا عوامل مذکور با مجموعه مدل‌ها ازجمله مدل خود رگرسیون برداری-گارچ (به عنوان مدل مبنا) و سایر مدل‌ها ذیل یادگیری ماشین مانند الگوریتم مبتنی بر تقویت گرادیان به عنوان مدل سطحی و مدل‌های شبکه عصبی پیچشی – حافظه طولانی کوتاه-مدت و واحد بازگشتی دارای دروازه به عنوان مدل یادگیری عمیق پیش‌بینی شوند. در نهایت با جایگذاری مقادیر پیش‌بینی شده سه عامل در معادله نلسون–سیگل پویا منحنی بازده آینده بازسازی ‌گردد. شایان ذکر است که هر یک از مدل‌ها از نظر پیچیدگی، تفسیرپذیری، نیازهای داده‌ای، الزامات محاسباتی و نوع روابط (خطی -غیرخطی)، ویژگی‌هایی متفاوت دارند.

یافته‌ها: یافته‌های پژوهش نشان می‌دهد که مدل خودرگرسیون برداری-گارچ در پیش‌بینی عامل سطح عملکرد بهتری نسبت به سایر مدل‌ها دارد. این برتری به دلیل ساختار خودرگرسیو این مدل است که برای تحلیل روندهای پایدار و طولانی مدت مناسب‌تر عمل می‌کند. در مقابل، مدل‌های یادگیری عمیق به دلیل محدودیت داده و ضعف در شناسایی روندهای طولانی مدت، دقت کمتری در پیش‌بینی این عامل داشته‌اند. اما در مورد عامل‌های شیب و انحنا که بیشتر تحت نوسانات کوتاه‌مدت و میان‌مدت قرار دارند، مدل‌های یادگیری عمیق عملکرد بهتری نسبت به مدل‌های سنتی از خود نشان داده‌اند. این برتری به توانایی آن‌ها در درک الگوهای پیچیده و غیرخطی در طول زمان بازمی‌گردد، درحالی‌که مدل‌های آماری کلاسیک به دلیل مفروضات سخت‌گیرانه در مواجهه با چنین نوساناتی دچار خطا می‌شوند. در مرحله بعد، پیش‌بینی سه عامل در معادله نلسون–سیگل پویا جای‌گذاری شده و دقت بازسازی منحنی بازده با معیار ریشه میانگین مربعات خطا سنجیده شد. نتایج نشان داد که هیچ‌یک از مدل‌ها به‌تنهایی برتری مطلق در پیش‌بینی هر سه عامل را ندارند. بنابراین، استفاده از ترکیب بهینه‌ از مدل‌ها – به‌گونه‌ای که هر عامل توسط مدلی با کمترین خطا پیش‌بینی شود – می‌تواند دقت بازسازی منحنی بازده را افزایش دهد و این رویکرد با ساختار مدل نلسون–سیگل، مبتنی بر فرض استقلال عامل‌ها از یکدیگر، نیز سازگار است. نتایج نشان داد در صورتیکه عامل سطح با مدل خود رگرسیون برداری – گارچ یا شبکه عصبی پیچشی – حافظه طولانی کوتاه‌مدت، شیب با واحد بازگشتی دارای دروازه و انحنا با مدل خود رگرسیون برداری-گارچ یا الگوریتم مبتنی بر تقویت گرادیان برآورد شوند به بهترین نتایج یعنی کمترین انحراف از واقعیت معادل حدود نیم درصد منجر خواهد شد.

نتیجه‌گیری: این پژوهش با هدف ارائه مدلی دقیق برای پیش‌بینی منحنی بازده در بازار مالی ایران انجام شد. بدین منظور، مدل نلسون-سیگل پویا انتخاب شد که منحنی بازده را در قالب سه عامل سطح، شیب و انحنا مدل‌سازی می‌کند. این تحقیق از مجموعه‌ مدل‌های سنجی و یادگیری ماشین جهت برآورد استفاده کرد. در مرحله نخست، عملکرد مدل‌ها در پیش‌بینی عامل‌های نلسون-سیگل ارزیابی شد. نتایج نشان داد که مدل خودرگرسیون برداری-گارچ برای پیش‌بینی عامل سطح عملکرد برتری دارد، در حالی که مدل‌های یادگیری عمیق در پیش‌بینی عامل های شیب و انحنا، که نوسانات کوتاه‌مدت و میان‌مدت دارند، دقیق‌تر عمل کردند. در مرحله دوم، دقت بازسازی منحنی بازده بر اساس عامل های پیش‌بینی‌شده سنجیده شد. یافته‌ها نشان داد که بهترین ترکیب برای پیش‌بینی منحنی زمانی حاصل می‌شود که عامل سطح با مدل خودرگرسیون برداری – گارچ یا شبکه عصبی پیچشی – حافظه طولانی کوتاه مدت، عامل شیب با واحد بازگشتی دارای دروازه و عامل انحنا با خودرگرسیون برداری-گارچ یا الگوریتم مبتنی بر تقویت گرادیان پیش‌بینی شود که منجر به خطای بازسازی کمتر از نیم درصد خواهد شد

کلیدواژه‌ها


عنوان مقاله [English]

Predicting Iran's Yield Curve: Combining Factor Model with Machine Learning Approach

نویسندگان [English]

  • saeed mohammadiaghdam 1
  • Moslem Peymany Foroushany 2
  • meysam Amiry 2
  • mohammad bahrani 3
1 Finance and Banking Department, Management and accounting Faculty, Allameh Tabataba’i University, Tehran, Iran.
2 Department of finance and banking, management and accounting faculty, Allameh Tabataba’i University, Tehran, Iran.
3 Department of computer, statistics,, mathematics and computer science, faculty, Allameh Tabataba’i University, Tehran,Iran
چکیده [English]

Purpose: The yield curve is a key analytical tool in economics, offering vital insights into market expectations regarding monetary policy, economic conditions, and inflation across various time horizons. It also plays a critical role in fiscal policymaking, financial institution modeling, and investment decisions such as asset valuation and risk management. Despite its importance, the analysis and forecasting of the yield curve have received limited attention in Iran. This becomes especially significant in the context of chronic inflation, currency volatility, international sanctions, and dependence on oil revenues. The present study aims to forecast the risk-free government bond yield curve in Iran. To this end, a two-dimensional forecasting approach across both time and maturity dimensions is employed, allowing for simultaneous analysis of the term structure and its dynamic behavior over time.

Methodology: Among the various approaches to yield curve forecasting, the Dynamic Nelson-Siegel (DNS) factor model is adopted as the foundational framework due to its interpretability, dimensionality reduction capabilities, and its ability to summarize the curve through three latent factors: level, slope, and curvature. These factors have well-established economic and financial interpretations and provide a meaningful basis for strategic and policy-level decision-making. Using data from Iranian Islamic Treasury Bills (ITBs), this study forecasts the aforementioned factors using a range of models, including the Vector Autoregressive-GARCH (VAR-GARCH) model as a classical baseline, gradient boosting algorithms as shallow machine learning models, and deep learning architectures such as Convolutional-Recurrent Long Short-Term Memory (Conv-LSTM) networks and Gated Recurrent Units (GRU). These models differ in terms of complexity, interpretability, data requirements, computational demands, and their capacity to capture linear or nonlinear relationships.

Findings: The empirical results reveal that the VAR-GARCH model outperforms others in forecasting the level factor, largely due to its autoregressive structure, which is better suited for modeling stable long-term trends. Conversely, deep learning models underperform in predicting the level factor due to limited data availability and difficulty in capturing persistent trends. However, for the slope and curvature factors—more influenced by short- and medium-term fluctuations—deep learning models demonstrate superior performance, owing to their ability to capture complex nonlinear temporal patterns. In contrast, traditional statistical models exhibit limitations in handling such fluctuations due to rigid assumptions. Subsequently, the predicted factors were integrated into the DNS model, and the accuracy of the reconstructed yield curve was evaluated using the Root Mean Square Error (RMSE). The results indicate that no single model dominates in predicting all three factors simultaneously. Therefore, a hybrid model strategy, in which each factor is forecasted by the most accurate model, leads to enhanced reconstruction performance. This approach is also theoretically consistent with the DNS model’s assumption of factor independence. The optimal configuration was achieved when the level factor was predicted using either VAR-GARCH or Conv-LSTM, the slope factor using GRU, and the curvature factor using either VAR-GARCH or a gradient boosting algorithm, resulting in a reconstruction error of approximately 0.5%.

Conclusion: This study introduces an accurate and data-driven framework for yield curve forecasting in the Iranian financial market by leveraging the Dynamic Nelson-Siegel model. Unlike previous studies that primarily relied on classical approaches such as VAR, this research integrates both shallow and deep machine learning models. In the first stage, these models were evaluated based on their ability to predict the DNS factors. The VAR-GARCH model was found to be most effective for forecasting the level factor, while deep learning models were more accurate in predicting slope and curvature. In the second stage, the reconstructed yield curve, based on the predicted factors, was assessed using RMSE. The findings suggest that a tailored combination of models for each factor—specifically, VAR-GARCH or Conv-LSTM for level, GRU for slope, and VAR-GARCH or gradient boosting for curvature—results in the highest forecasting accuracy, with a reconstruction error of less than 0.5%.

کلیدواژه‌ها [English]

  • Yield Curve
  • Factor Model
  • Machine Learning
  • Deep Learning
  • Fixed Income Securities
  1. Argyropoulos, E., & Tzavalis, E. (2016). Forecasting economic activity from yield curve factors. The North American Journal of Economics and Finance, 36, 293-311.‏
  2. Ang, A., Piazzesi, M., & Wei, M. (2006). What does the yield curve tell us about GDP growth? Journal of Econometrics, 131(1-2), 359-371. https://doi.org/10.1016/j.jeconom.2005.04.004
  3. Bank for international settlements (2005) Zero-coupon yield curves: technical documentation. Monetary and economic department. No. 25.
  4. Bayaa, Y., & Qadan, M. (2024). The shape of the Treasury yield curve and commodity prices. International Review of Financial Analysis, 94, 103311
  5. Bianchi, M Büchner, A Tamoni (2021) Bond Risk Premiums with Machine Learning, The Review of Financial Studies, volume 34, p. 1046 – 1089.
  6. Bliss, R. R. (1996). Testing term structure estimation methods (No. 96-12a). Working Paper.‏
  7. Bolder, D.J. and Liu, S. (2007). Examining simple joint macroeconomic and term-structure models: a practitioner’s perspective. Bank of Canada working paper no. 2007-49.
  8. Borio, C., Gambacorta, L., & Hofmann, B. (2017). The influence of monetary policy on bank profitability. International finance, 20(1), 48-63.‏
  9. Boukhatem, J., & Sekouhi, H. (2017). What does the bond yield curve tell us about Tunisian economic activity? Research in International Business and Finance, 42, 295-303.‏
  10. Caldeira, J., Torrent, H., )2017(. Forecasting the US term structure of interestrates using nonparametric functional data analysis. Journal of Forecasting 36 (1), 56–7.
  11. Castellani, M., Santos, E. A. d., )2006(. Forecasting long-term government bond yields: an application of statistical and AI models. ISEG, Departamento de Economia
  12. Castro-Iragorri, J Ramírez. (2021) Forecasting Dynamic Term Structure Models with Autoencoders. Documentos De Trabajo 019431.
  13. Cao, Y. (2023). Forecast Yield Curve of China’s Government Bond with Machine Learning. .‏
  14. CERNA, S., GUYEUX, C., ARCOLEZI, H. H., COUTURIER, R., and ROYER, G. (2020). A comparison of lstm and xgboost for predicting _remen interventions. In World Conference on Information Systems and Technologies, pages 424{434. Springer.
  15. Chae S.C., Choi S.Y. (2022), Analysis of the term structure of major currencies using principal component analysis and autoencoders, Axioms, 11(3), 135.
  16. CHEN, T. and GUESTRIN, C. (2016). Xgboost: A scalable tree boosting system. In Pro- ceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pages 785-794.
  17. Cho, K.; van Merrienboer, B.; Bahdanau, D.; Bengio, Y. (2014) On the Properties of Neural Machine Translation: Encoder-Decoder Approaches. arXiv:1409.1259
  18. Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning phrase representations using RNN encoder-decoder for statistical machine translation. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 1724-1734. https://aclanthology.org/D14-1179
  19. Chou, J., Su, Y., Tang, H., & Chen, C. (2009). Fitting the term structure of interest rates in illiquid market: Taiwan experience. Investment Management and Financial Innovations, 6(1), 101–116.
  20. Christensen, J., Diebold, F., & Rudebusch, G. (2009). An arbitrage-free generalized nelson-siegel term structure model. The Econometrics Journal, 12(3), 33–64. https://doi.org/10.1111/j.1368- 423X.2008.00267.x
  21. Christensen, J., Diebold, F., & Rudebusch, G. (2007). The afne arbitrage–free class of nelson–siegel term structure models. Working Paper 13611, National Bureau of Economic Research. https:// doi.org/10.3386/w13611
  22. Cox, J. C., Ingersoll, J. E., & Ross, S. A. (1985). A theory of the term structure of interest rates. Econometrica, 53(2), 385-407. https://doi.org/10.2307/1911242
  23. Diebold, F. X., & Li, C. (2006). Forecasting the term structure of government bond yields. Journal of Econometrics, 130(2), 337-364. https://doi.org/10.1016/j.jeconom.2005.04.014
  24. Dunis, C. L., Morrison, V., )2007(. The economic value of advanced time series methods for modelling and trading 10-year government bonds. European Journal of Finance 13 (4), 333–352.
  25. Enders, W.,)2014(. Applied Econometric Time Series, 4th Edition. Wiley Series in Probability and Statistics. Wiley.
  26. Engle, R. F. (1982). Autoregressive conditional heteroskedasticity with estimates of the variance of United Kingdom inflation. Econometrica, 50(4), 987-1007. https://doi.org/10.2307/1912773
  27. Estrella, A., & Hardouvelis, G. A. (1991). The term structure as a predictor of real economic activity. The journal of Finance, 46(2), 555-576.‏
  28. Gogas, P., Papadimitriou, T., Matthaiou, M., & Chrysanthidou, E. (2015). Yield curve and recession forecasting in a machine learning framework. Computational Economics, 45, 635–645. https:// doi.org/10.1007/s10614-014-9432-0
  29. Hamilton, J. D. (1994). Time series analysis. Princeton University Press.
  30. Kanevski, M., Maignan, M., Pozdnoukhov, A., Timonin, V., )2008(. Interest rates mapping. Physica A: Statistical Mechanics and its Applications 387 (15), 15 3897–3903.
  31. Kanevski, M., Timonin, V., )2010(. Machine learning analysis and modeling of interest rate curves. European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, ESANN.
  32. Kang, K. (2012). Forecasting the term structure of korean government bond yields using the dynamic nelson-siegel class models. Asia-Pacifc Journal of Financial Studies, 41(6), 765–787. https:// doi.org/10.1111/ajfs.12000
  33. Kauffmann P. C., Takada, H. H., Terada, A. T. & Stern, J. M. (2022). Learning ForecastEfficient Yield Curve Factor Decompositions with Neural Networks. Econometrics, 10.
  34. Kirczenow, G., Fathi, A. & Davison, M. (2018). Machine Learning for Yield Curve Feature Extraction: Application to Illiquid Corporate Bonds. Arxiv Preprint Arxiv:1806.01731.
  35. Knapp, B. (2020). Macroeconomic factors in interest rate modelling (Doctoral dissertation, Wien).‏
  36. Koopman, S., Mallee, M., & Van der Wel, M. (2007). Analyzing the term structure of interest rates using the dynamic Nelson-Siegel model with time-varying parameters. Tinbergen Institute Discussion Papers 07-095/4, Tinbergen Institute
  37. Kostyra, T. P. (2024). Forecasting the yield curve for Poland with the PCA and machine learning. Bank i Kredyt, 56(4), 459-478.‏
  38. Linton, O., Mammen, E., Nielsen, J., & Tanggaard, C. (2001). Yield curve estimation by kernel smoothing methods. Journal of Econometrics, 105(1), 185–223. https://doi.org/10.1016/S0304- 4076(01)00075-6
  39. Litterman R., Scheinkman J. (1991), Common factors affecting bond returns, Journal of Fixed Income, 1(1), 54–61.
  40. Lorenčič, E. (2016). Testing the performance of cubic splines and Nelson-Siegel model for estimating the zero-coupon yield curve. Naše gospodarstvo/Our Economy, 62(2), 42–50. https://doi.org/10. 1515/ngoe-2016-0011
  41. Lu, W., Li, J., Li, Y., Sun, A., & Wang, J. (2020). A CNN‐LSTM‐based model to forecast stock prices. Complexity, 2020(1), 6622927.‏
  42. Lütkepohl, H., & Krätzig, M. (2004). Applied time series econometrics. Cambridge University Press.
  43. Lynn, H.M.; Pan, S.B.; Kim, P. A (2019) Deep Bidirectional GRU Network Model for Biometric Electrocardiogram Classification Based on Recurrent Neural Networks. IEEE Access, 7, 145395–145405
  44. Mallick A.K., Mishra A.K. (2019), Interest rates forecasting and stress testing in India: a PCA-ARIMA approach, Palgrave Communications, 5(1), 1–17.
  45. Mateus, B. C., Mendes, M., Farinha, J. T., Assis, R., & Cardoso, A. M. (2021). Comparing LSTM and GRU models to predict the condition of a pulp paper press. Energies, 14(21), 6958.‏
  46. Mishkin, F. S. (2019). The economics of money, banking, and financial markets, Global edition. 12th Edition, Pearson Education.‏
  47. Nagy, K. (2020). Term structure estimation with missing data: Application for emerging markets. The Quarterly Review of Economics and Finance, 75, 347–360. https://doi.org/10.1016/j.qref.2019. 04.002
  48. Nath G.C. (2012), Estimating term structure changes using principal component analysis in the Indian sovereign bond market, SSRN 2075635
  49. Nelson, C. R., & Siegel, A. F. (1987). Parsimonious modeling of yield curves. Journal of Business, 60(4), 473–489. https://doi.org/10.1086/296368
  50. Nichani, R., Gasmi, L., Laiche, N., & Kabou, S. (2024). Optimizing financial time series predictions with hybrid ARIMA, LSTM, and XGBoost Models. Studies in Engineering and Exact Sciences, 5(2), e11188-e11188.‏
  51. Nunes, M., Gerding, E., McGroarty, F., & Niranjan, M. (2019). A comparison of multitask and single-task learning with artificial neural networks for yield curve forecasting. Expert Systems with Applications, 119, 362-375.‏
  52. Nunes, M. (2022). Machine learning in fixed income markets: forecasting and portfolio management (Doctoral dissertation, University of Southampton).‏
  53. Nymand-Andersen, P. (2018). Yield curve modelling and a conceptual framework for estimating yield curves: evidence from the European Central Bank's yield curves (No. 27). ECB Statistics Paper.‏
  54. Oprea A. (2022), The use of Principal Component Analysis (PCA) in building yield curve scenarios and identifying relative-value trading opportunities on the Romanian government bond market, Journal of Risk and Financial Management, 15(6), 247.
  55. Piene, F. B., & Vedvik, J. O. (2020). Forecasting the US Treasury Yield Curve using Targeted Diffusion Indices (Master's thesis, Handelshøyskolen BI).‏
  56. Pimentel R., Risstad M., Westgaard S. (2022), Predicting interest rate distributions using PCA & quantile regression, Digital Finance, 4(4), 291–311.
  57. Rezende, R., & Ferreira, M. (2008). Modeling and forecasting the Brazilian term structure of interest rates by an extended Nelson-Siegel class of models: A quantile autoregression approach. resreport, Escola Brasileira de Economia e Finanças.
  58. Sambasivan, R., Das, S. )2017(. A statistical machine learning approach to yield curve forecasting. In: International Conference on Computational Intelligence in Data Science, ICCIDS. IEEE, pp. 1–6.
  59. Sewell, M. )2011(. Characterization of financial time series. UCL Department of Computer Science,
  60. Suimon, Y., Sakaji, H., Izumi, K. & Matsushima, H. (2020a). Autoencoder-based ThreeFactor Model for the Yield Curve of Japanese Government Bonds and A Trading Strategy. Journal of Risk and Financial Management, 13, 82-103.
  61. Suimon, Y., Sakaji, H., Izumi, K., Shimada, T. & Matsushima, H. (2020b). Japanese Interest Rate Forecast Considering the Linkage of Global Markets using Machine Learning Methods. International Journal of Smart Computing and Artificial Intelligence, 4, 1-17.
  62. Svensson, L. E. (1995). Estimating forward interest rates with the extended Nelson & Siegel method. Sveriges Riksbank Quarterly Review, 3(1), 13-26.‏
  63. Ullah, W. (2017). Term structure forecasting in afne framework with time-varying volatility. Stat Methods Appl, 26, 453–483. https://doi.org/10.1007/s10260-017-0378-y
  64. Umar, Z., Yousaf, I., & Aharon, D. Y. (2021). The relationship between yield curve components and equity sectorial indices: evidence from China. Pacific-Basin Finance Journal, 68, 101591.‏
  65. Walstrøm R, Paraschiv F, Schürle M. (2022). A comparative analysis of parsimonious yield curve models with a focus on the Nelson-Siegel, Svensson, and Bliss versions. Computational Economics 59:967–1004
  66. Widiputra, H., Mailangkay, A., & Gautama, E. (2021). Multivariate CNN‐LSTM Model for Multiple Parallel Financial Time‐Series Prediction. Complexity,2021(1), 9903518.‏
  67. Zhang, X., Song, Y., & Liu, Y. (2018). Deep learning for time series forecasting: A survey. In Proceedings of the 2018 International Conference on Machine Learning and Data Mining (pp. 45-59). Springer. https://doi.org/10.1007/978-3-319-99068-4_6.