پیش‌بینی منحنی بازده ایران: ترکیب مدل عاملی با رویکرد یادگیری ماشین

نوع مقاله : علمی - پژوهشی

نویسندگان

1 گروه مالی و بانکداری، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی(ره)، تهران، ایران،

2 گروه مالی و بانکداری، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی(ره)، تهران، ایران.

3 گروه رایانه، دانشکده آمار، ریاضی و رایانه، دانشگاه علامه طباطبائی(ره)، تهران، ایران.

چکیده

هدف: منحنی بازده یکی از ابزارهای کلیدی در تحلیل‌های اقتصادی به‌شمار می‌رود که نقش مهمی در تفسیر انتظارات بازار نسبت به سیاست‌های پولی، وضعیت اقتصادی و تورم در بازه‌های زمانی مختلف ایفا می‌کند. این منحنی همچنین در حوزه‌هایی چون سیاست‌گذاری مالی، مدل‌سازی کسب‌وکار نهادهای مالی و تصمیم‌گیری‌های سرمایه‌گذاری مانند ارزش‌گذاری دارایی‌ها و مدیریت ریسک کاربرد فراوانی دارد. با وجود اهمیت بالای موضوع، پیش‌بینی و تحلیل منحنی بازده در ایران کمتر مورد توجه قرار گرفته است درحالیکه اقتصاد ایران با چالش‌هایی مانند تورم مزمن، نوسانات ارزی، تحریم‌ها و وابستگی به درآمدهای نفتی مواجه است. هدف این پژوهش، پیش‌بینی منحنی بازده اوراق دولتی بدون ریسک در ایران است. در این راستا، پیش‌بینی‌ با توجه به دو بعد زمان و سررسید انجام شد به طوریکه ضمن بررسی رفتار بازده‌ اوراق با سررسید مختلف در هر زمان، روند تغییرات هر سررسید در طول زمان نیز تحلیل شد.

روش: با وجود توسعه روش‌های مختلف برای پیش‌بینی منحنی بازده، مدل عاملی نلسون-سیگل پویا به‌دلیل تفسیرپذیری بالا، کاهش ابعاد و توانایی خلاصه‌سازی منحنی در سه عامل کلیدی سطح، شیب و انحنا، به‌عنوان چارچوب پایه برآورد انتخاب شد. این عوامل به‌دلیل دلالت‌های اقتصادی و مالی مشخص، نقشی مهم در تصمیم‌گیری‌های سیاستی و راهبردی ایفا می‌کنند. در این پژوهش، با استفاده از داده‌های اسناد خزانه اسلامی در بازار سرمایه ایران، تلاش شد تا عوامل مذکور با مجموعه مدل‌ها ازجمله مدل خود رگرسیون برداری-گارچ (به عنوان مدل مبنا) و سایر مدل‌ها ذیل یادگیری ماشین مانند الگوریتم مبتنی بر تقویت گرادیان به عنوان مدل سطحی و مدل‌های شبکه عصبی پیچشی – حافظه طولانی کوتاه-مدت و واحد بازگشتی دارای دروازه به عنوان مدل یادگیری عمیق پیش‌بینی شوند. در نهایت با جایگذاری مقادیر پیش‌بینی شده سه عامل در معادله نلسون–سیگل پویا منحنی بازده آینده بازسازی ‌گردد. شایان ذکر است که هر یک از مدل‌ها از نظر پیچیدگی، تفسیرپذیری، نیازهای داده‌ای، الزامات محاسباتی و نوع روابط (خطی -غیرخطی)، ویژگی‌هایی متفاوت دارند.

یافته‌ها: یافته‌های پژوهش نشان می‌دهد که مدل خودرگرسیون برداری-گارچ در پیش‌بینی عامل سطح عملکرد بهتری نسبت به سایر مدل‌ها دارد. این برتری به دلیل ساختار خودرگرسیو این مدل است که برای تحلیل روندهای پایدار و طولانی مدت مناسب‌تر عمل می‌کند. در مقابل، مدل‌های یادگیری عمیق به دلیل محدودیت داده و ضعف در شناسایی روندهای طولانی مدت، دقت کمتری در پیش‌بینی این عامل داشته‌اند. اما در مورد عامل‌های شیب و انحنا که بیشتر تحت نوسانات کوتاه‌مدت و میان‌مدت قرار دارند، مدل‌های یادگیری عمیق عملکرد بهتری نسبت به مدل‌های سنتی از خود نشان داده‌اند. این برتری به توانایی آن‌ها در درک الگوهای پیچیده و غیرخطی در طول زمان بازمی‌گردد، درحالی‌که مدل‌های آماری کلاسیک به دلیل مفروضات سخت‌گیرانه در مواجهه با چنین نوساناتی دچار خطا می‌شوند. در مرحله بعد، پیش‌بینی سه عامل در معادله نلسون–سیگل پویا جای‌گذاری شده و دقت بازسازی منحنی بازده با معیار ریشه میانگین مربعات خطا سنجیده شد. نتایج نشان داد که هیچ‌یک از مدل‌ها به‌تنهایی برتری مطلق در پیش‌بینی هر سه عامل را ندارند. بنابراین، استفاده از ترکیب بهینه‌ از مدل‌ها – به‌گونه‌ای که هر عامل توسط مدلی با کمترین خطا پیش‌بینی شود – می‌تواند دقت بازسازی منحنی بازده را افزایش دهد و این رویکرد با ساختار مدل نلسون–سیگل، مبتنی بر فرض استقلال عامل‌ها از یکدیگر، نیز سازگار است. نتایج نشان داد در صورتیکه عامل سطح با مدل خود رگرسیون برداری – گارچ یا شبکه عصبی پیچشی – حافظه طولانی کوتاه‌مدت، شیب با واحد بازگشتی دارای دروازه و انحنا با مدل خود رگرسیون برداری-گارچ یا الگوریتم مبتنی بر تقویت گرادیان برآورد شوند به بهترین نتایج یعنی کمترین انحراف از واقعیت معادل حدود نیم درصد منجر خواهد شد.

نتیجه‌گیری: این پژوهش با هدف ارائه مدلی دقیق برای پیش‌بینی منحنی بازده در بازار مالی ایران انجام شد. بدین منظور، مدل نلسون-سیگل پویا انتخاب شد که منحنی بازده را در قالب سه عامل سطح، شیب و انحنا مدل‌سازی می‌کند. این تحقیق از مجموعه‌ مدل‌های سنجی و یادگیری ماشین جهت برآورد استفاده کرد. در مرحله نخست، عملکرد مدل‌ها در پیش‌بینی عامل‌های نلسون-سیگل ارزیابی شد. نتایج نشان داد که مدل خودرگرسیون برداری-گارچ برای پیش‌بینی عامل سطح عملکرد برتری دارد، در حالی که مدل‌های یادگیری عمیق در پیش‌بینی عامل های شیب و انحنا، که نوسانات کوتاه‌مدت و میان‌مدت دارند، دقیق‌تر عمل کردند. در مرحله دوم، دقت بازسازی منحنی بازده بر اساس عامل های پیش‌بینی‌شده سنجیده شد. یافته‌ها نشان داد که بهترین ترکیب برای پیش‌بینی منحنی زمانی حاصل می‌شود که عامل سطح با مدل خودرگرسیون برداری – گارچ یا شبکه عصبی پیچشی – حافظه طولانی کوتاه مدت، عامل شیب با واحد بازگشتی دارای دروازه و عامل انحنا با خودرگرسیون برداری-گارچ یا الگوریتم مبتنی بر تقویت گرادیان پیش‌بینی شود که منجر به خطای بازسازی کمتر از نیم درصد خواهد شد

کلیدواژه‌ها


عنوان مقاله [English]

Predicting Iran's Yield Curve: Combining Factor Model with Machine Learning Approach

نویسندگان [English]

  • saeed mohammadiaghdam 1
  • Moslem Peymany Foroushany 2
  • meysam Amiry 2
  • mohammad bahrani 3
1 Finance and Banking Department, Management and accounting Faculty, Allameh Tabataba’i University, Tehran, Iran.
2 Department of finance and banking, management and accounting faculty, Allameh Tabataba’i University, Tehran, Iran.
3 Department of computer, statistics,, mathematics and computer science, faculty, Allameh Tabataba’i University, Tehran,Iran
چکیده [English]

Purpose: The yield curve is a key analytical tool in economics, offering vital insights into market expectations regarding monetary policy, economic conditions, and inflation across various time horizons. It also plays a critical role in fiscal policymaking, financial institution modeling, and investment decisions such as asset valuation and risk management. Despite its importance, the analysis and forecasting of the yield curve have received limited attention in Iran. This becomes especially significant in the context of chronic inflation, currency volatility, international sanctions, and dependence on oil revenues. The present study aims to forecast the risk-free government bond yield curve in Iran. To this end, a two-dimensional forecasting approach across both time and maturity dimensions is employed, allowing for simultaneous analysis of the term structure and its dynamic behavior over time.

Methodology: Among the various approaches to yield curve forecasting, the Dynamic Nelson-Siegel (DNS) factor model is adopted as the foundational framework due to its interpretability, dimensionality reduction capabilities, and its ability to summarize the curve through three latent factors: level, slope, and curvature. These factors have well-established economic and financial interpretations and provide a meaningful basis for strategic and policy-level decision-making. Using data from Iranian Islamic Treasury Bills (ITBs), this study forecasts the aforementioned factors using a range of models, including the Vector Autoregressive-GARCH (VAR-GARCH) model as a classical baseline, gradient boosting algorithms as shallow machine learning models, and deep learning architectures such as Convolutional-Recurrent Long Short-Term Memory (Conv-LSTM) networks and Gated Recurrent Units (GRU). These models differ in terms of complexity, interpretability, data requirements, computational demands, and their capacity to capture linear or nonlinear relationships.

Findings: The empirical results reveal that the VAR-GARCH model outperforms others in forecasting the level factor, largely due to its autoregressive structure, which is better suited for modeling stable long-term trends. Conversely, deep learning models underperform in predicting the level factor due to limited data availability and difficulty in capturing persistent trends. However, for the slope and curvature factors—more influenced by short- and medium-term fluctuations—deep learning models demonstrate superior performance, owing to their ability to capture complex nonlinear temporal patterns. In contrast, traditional statistical models exhibit limitations in handling such fluctuations due to rigid assumptions. Subsequently, the predicted factors were integrated into the DNS model, and the accuracy of the reconstructed yield curve was evaluated using the Root Mean Square Error (RMSE). The results indicate that no single model dominates in predicting all three factors simultaneously. Therefore, a hybrid model strategy, in which each factor is forecasted by the most accurate model, leads to enhanced reconstruction performance. This approach is also theoretically consistent with the DNS model’s assumption of factor independence. The optimal configuration was achieved when the level factor was predicted using either VAR-GARCH or Conv-LSTM, the slope factor using GRU, and the curvature factor using either VAR-GARCH or a gradient boosting algorithm, resulting in a reconstruction error of approximately 0.5%.

Conclusion: This study introduces an accurate and data-driven framework for yield curve forecasting in the Iranian financial market by leveraging the Dynamic Nelson-Siegel model. Unlike previous studies that primarily relied on classical approaches such as VAR, this research integrates both shallow and deep machine learning models. In the first stage, these models were evaluated based on their ability to predict the DNS factors. The VAR-GARCH model was found to be most effective for forecasting the level factor, while deep learning models were more accurate in predicting slope and curvature. In the second stage, the reconstructed yield curve, based on the predicted factors, was assessed using RMSE. The findings suggest that a tailored combination of models for each factor—specifically, VAR-GARCH or Conv-LSTM for level, GRU for slope, and VAR-GARCH or gradient boosting for curvature—results in the highest forecasting accuracy, with a reconstruction error of less than 0.5%.

کلیدواژه‌ها [English]

  • Yield Curve
  • Factor Model
  • Machine Learning
  • Deep Learning
  • Fixed Income Securities