تفسیرِ پیش‌بینی بازده شاخص قیمت صنایع تولیدی بورس اوراق بهادار تهران با استفاده از یادگیری تجمیعی توضیح‌پذیر

نوع مقاله : علمی - پژوهشی

نویسندگان

1 استاد تمام مدیریت مالی، دانشکده مالی و حسابداری، دانشکدگان مدیریت، دانشگاه تهران، ایران.

2 کارشناسی ارشد مدیریت مالی، دانشکده مالی و حسابداری، دانشکدگان مدیریت، دانشگاه تهران، ایران.

3 استادیار گروه مدیریت صنعتی، دانشکده علوم انسانی، دانشگاه میبد، ایران.

4 دانشجوی کارشناسی ارشد الگوریتم‌ها و محاسبات، دانشکده‌ مهندسی برق و کامپیوتر، دانشکدگان فنی، دانشگاه تهران، ایران.

10.48308/jfmp.2025.238860.1475

چکیده

هدف: امروزه، یادگیری ماشین به ‌عنوان ابزاری کارآمد در پیش‌بینی سری‌های زمانی مالی مورد توجه قرار گرفته است. با این ‌حال، اغلب این مدل‌ها به عنوان مدل‌های جعبه ‌سیاه به دلیل عدم شفافیت، موجب کاهش اعتماد به نتایج پیش‌بینی شده‌اند. برای رفع این محدودیت، بهره‌گیری از مدل‌های هوش مصنوعی توضیح‌پذیر که امکان تحلیل دقیق ساز و کار پیش‌بینی را فراهم می‌آورند، ضروری است. بر این اساس، هدف این پژوهش، توسعه و ارزیابی یک مدل پیش‌بینی مبتنی بر هوش مصنوعی است که علاوه بر دقت بالا، از قابلیت توضیح‌پذیری نیز برخوردار باشد. در این راستا، نقش و سهم متغیرهای ورودی در پیش‌بینی‌های مدل به ‌طور شفاف مشخص شده و پایداری نتایج آن از نظر دقت و قابلیت توضیح‌پذیری، با استفاده از روش‌های اعتبارسنجی متقاطع، به‌ویژه بخش‌بندی سری‌های زمانی، مورد ارزیابی قرار می‌گیرد.
روش: این پژوهش از نظر هدف، کاربردی و از نظر روش، توصیفی- تحلیلی با رویکرد پیش‌بینی کمّی است که برای نخستین‌ بار در ایران به بررسی قابلیت توضیح‌پذیری هوش مصنوعی بهینه ‌شده در پیش‌بینی بازده شاخص قیمت هشت صنعت تولیدی بورس اوراق بهادار تهران می‌پردازد. داده‌های پژوهش شامل شاخص‌های صنایع در بازه زمانی ۱۳۹۷ تا ۱۴۰۲ است که از پایگاه‌های اطلاعاتی (بورس ‌ویو) جمع‌آوری شده‌اند. برای آموزش مدل جنگل تصادفی به عنوان یک مدل یادگیری تجمیعی، متغیرهای تکنیکال، بنیادی و کلان اقتصادی به عنوان ویژگی‌های مدل، مورد بررسی قرار گرفته‌اند. همچنین الگوریتم ژنتیک به منظور بهینه‌سازی هایپرپارامترهای این مدل به کار گرفته شده است. به ‌منظور افزایش شفافیت و اعتمادپذیری مدل، از تکنیک‌ تفسیرپذیری شاپ برای شناخت تأثیر و اهمیت ویژگی‌ها استفاده شده است.
یافته‌ها: نتایج این پژوهش نشان می‌دهد که ترکیب الگوریتم جنگل تصادفی با بهینه‌سازی هایپرپارامترها از طریق الگوریتم ژنتیک و استفاده از روش‌ توضیح‌پذیری همچون مقادیر شاپ، علاوه بر افزایش دقت پیش‌بینی بازده شاخص قیمت صنایع تولیدی بورس تهران، شفافیت و اعتمادپذیری مدل را نیز ارتقا می‌دهد. یافته‌ها تأکید دارند که متغیرهای تکنیکال، به ‌ویژه شاخص میانگین متحرک نمایی، شاخص همگرایی و واگرایی میانگین متحرک، حجم معاملات و میزان سهام شناور، بیشترین نقش را در بهبود دقت پیش‌بینی ایفا می‌کنند. در مقابل، متغیرهای بنیادی همچون نسبت قیمت به درآمد و نرخ بهره و نرخ تورم تأثیرگذارند، اما نقش آن‌ها نسبت به متغیرهای تکنیکال کمتر است. علاوه بر این، ارزیابی متقاطع سری زمانی، پایداری و تعمیم‌پذیری بالای مدل پیشنهادی را در دوره‌های مختلف تأیید می‌کند.
نتیجه‌گیری: با توجه به هم‌خوانی نتایج این پژوهش با مطالعات معتبر بین‌المللی می‌توان نتیجه گرفت که مدل‌های هوش‌مصنوعی توضیح‌پذیر نه‌تنها عملکرد خوبی نسبت به مدل‌های سنتی دارند، بلکه تحلیلگران مالی را در اتخاذ تصمیمات آگاهانه و مؤثر یاری کرده و می‌توانند نقشی کلیدی در مدیریت ریسک و بهینه‌سازی سبد دارایی‌ها ایفا کنند. بدین ترتیب، مدل پیشنهادی با شفافیت عملکرد و قابلیت اطمینان بالا، به ‌عنوان ابزاری مؤثر برای تحلیلگران مالی معرفی شده و افق‌های تازه‌ای را در کاربرد هوش مصنوعی توضیح‌پذیر در صنعت مالی ایران می‌گشاید.

کلیدواژه‌ها


عنوان مقاله [English]

Interpreting Forecast the Return of the Price Index of Manufacturing Industries in the Tehran Stock Exchange Using Explainable Ensemble Learning

نویسندگان [English]

  • Reza Raei 1
  • Masoud Vahdati 2
  • Hossein Mohebbi 3
  • Amirhossein Heydari Delooei 4
1 Professor of finance management, faculty of accounting and finance, college of management, university of Tehran. Iran.
2 Msc of finance management, faculty of accounting and finance, college of management, university of Tehran. Iran.
3 Assistant Professor, Industrial Management Deptment, Meybod University, Meybod, Iran
4 Msc Student of Algrithms and Computations, faculty of Electrical and Computer Engineering (ECE), college of Engineering, University of Tehran. Iran.
چکیده [English]

Purpose: In recent years, machine learning has gained significant attention as an effective tool for forecasting financial time series. However, many of these models function as black boxes, and their lack of transparency has led to reduced trust in their predictions. To address this limitation, the use of explainable artificial intelligence (XAI) models-capable of providing detailed insights into the prediction mechanisms-has become essential. Accordingly, the aim of this study is to develop and evaluate an artificial intelligence (AI)-based forecasting model that not only delivers high accuracy but also offers strong interpretability. In this context, the contribution and role of input variables in the model's predictions are explicitly identified, and the stability of the results in terms of both accuracy and explain ability is assessed using cross-validation techniques, particularly time series splitting.
Method: This applied research adopts a descriptive-analytical method with a quantitative forecasting approach. For the first time in Iran, it investigates the explain ability of optimized artificial intelligence models in forecasting the return of the price index for eight manufacturing industries listed on the Tehran Stock Exchange. The dataset, covering the period from 2018 to 2023, was collected from the Bourse View database. The Random Forest algorithm, as an ensemble learning method, was trained using a combination of technical, fundamental, and macroeconomic variables as input features. A Genetic Algorithm was utilized to optimize the model’s hyperparameters. To enhance transparency and model credibility, the SHAP (shapley additive explanations) technique was employed to analyze the influence and importance of each feature in the prediction process.
Findings: The results demonstrate that combining the Random Forest algorithm with Genetic Algorithm-based hyperparameter optimization and incorporating explain ability techniques such as SHAP values not only improves the prediction accuracy of the price index returns for Tehran’s manufacturing industries but also enhances model transparency and reliability. The findings highlight those technical indicators-particularly the Exponential Moving Average (EMA), MACD (Moving Average Convergence Divergence) index, trading volume, and free float shares-play the most significant role in enhancing predictive accuracy. In contrast, fundamental variables such as the price-to-earnings ratio and interest rates are influential but less impactful compared to technical indicators. Furthermore, time series cross-validation confirms the robustness and generalizability of the proposed model across different time periods.
Conclusion: In line with reputable international studies, the results suggest that explainable artificial intelligence (AI) models not only outperform traditional models in predictive tasks but also assist financial analysts in making informed and effective decisions. These models can play a pivotal role in risk management and portfolio optimization. Therefore, the proposed model-featuring operational transparency and high reliability- is introduced as an effective tool for financial analysts, opening new horizons for the application of explainable artificial intelligence (AI) in Iran’s financial sector.

کلیدواژه‌ها [English]

  • Explainable Artificial Intelligence
  • Random Forest
  • Genetic Algorithm
  • Cross-Validation
  • Tehran Stock Exchange