DOI: 10.47026/1810-1909-2023-2-76-84
УДК 621.316.91
ББК 31.247
А.Т. ГРИГОРЬЕВ, Н.А. КУЗНЕЦОВ, Е.В. СЛАВУТСКАЯ
Ключевые слова
многомерные информационные потоки, машинное обучение, дерево решений, классификация, распознавание связей
Аннотация
Цель исследования – показать возможности методов машинного обучения для анализа внутрисистемных связей многомерных данных. В современных системах автоматизированного управления технологическими процессами, и, в частности, в электроэнергетике, необходим непрерывный мониторинг информационного обмена. Потоки данных носят случайный многомерный характер и передаваемые по каналам связи параметры имеют разные диапазоны варьирования и размерность. В этих условиях актуальным является развитие методов статистического контроля внутрисистемных связей таких данных.
Материалы и методы. Для решения задачи в работе применен метод машинного обучения «дерево решений». Возможности подхода продемонстрированы при анализе взаимосвязей данных, моделирующих поток, содержащий 27 случайных параметров с разной размерностью. Проверка проводилась на выборке от 100 до 500 значений каждого из параметров.
Результаты. Показано, что статистический контроль может осуществляться без рассмотрения структуры самого дерева решений по таким показателям, как процент распознавания связей, диапазоны разбиения значений параметров при классификации, значимость отдельных параметров (атрибутов).
Выводы. Поскольку алгоритм не требует большой выборки значений анализируемых параметров, статистический контроль может осуществляться в скользящем временном окне. Показано, что подход может быть использован для анализа информационного обмена в системах автоматизированного управления технологическими процессами.
Литература
- Вертикальный системный анализ данных психодиагностики учащихся с использованием метода «дерево решений» / Е.В. Славутская, Л.А. Славутский, В.С. Абруков и др. // Science for Education Today. 2020. № 3. С. 87–107. DOI: http://dx.doi.org/10.15293/2658-6762.2003.05.
- Дюк В., Самойленко А. Data Mining: учебный курс. СПб.: Питер, 2001. 386 с.
- Левитин А.В. Ограничения мощи алгоритмов: Деревья принятия решения // Алгоритмы. Введение в разработку и анализ (глава 10). М.: Вильямс, 2006. С. 409-417.
- Славутская Е.В., Славутский Л.А. О выборе структуры искусственных нейросетей и алгоритмов анализа психодиагностических данных // Казанский педагогический журнал. 2020. № 5(142). С. 202–211.
- Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R [Электронный ресурс]. URL: https://ranalytics.github.io/data-mining.
- Adriaens, F., Lijffijt J., De Bie T. Subjectively interesting connecting trees and forests. Data Min Knowl Disc, 2019, vol. 33, pp. 1088–1124. DOI: https://doi.org/10.1007/s10618-019-00627-1.
- Andreev O.N., Slavutskiy A.L., Slavutskii L.A. Neural network in a sliding window for power grids signals structural analysis. IOP Conference Series: Earth and Environmental Science, 2022, vol. DOI: 10.1088/1755-1315/990/1/012054.
- Breiman L., Friedman J.H., Olshen R.A., Stone C.J. Classification and regression trees. Monterey C A: Wadsworth & Brooks/Cole Advanced Books & Software, 1984, 366 p.
- Genrikhov I.E., Djukova E.V., Zhuravlev V.I. On full regression decision trees. Pattern Recognit. Image Anal., 2017, vol. 27, pp. 1–7. DOI: https://doi.org/10.1134/S1054661817010047.
- Grossberg S. A Path Toward Explainable AI and Autonomous Adaptive Intelligence: Deep Learning, Adaptive Resonance, and Models of Perception, Emotion, and Action. Neurorobot, 2020, vol. 14. DOI: https://doi.org/10.3389/fnbot.2020.00036.
- Holena M., Pulc P., Kopp M. Classification Methods for Internet Applications. Springer. 2020. DOI: 1007/978-3-030-36962-0.
- Ivanov S.O., Nikandrov M., Lariukhin A. Neuro Algorithm Accuracy Evaluation for The Anomalies Detecting in Overcurrent Protection Operation. In: International Ural Conference on Electrical Power Engineering (UralCon), 2021, pp. 116–120. DOI: 10.1109/UralCon52005.2021.9559614.
- Kantardzic M. Data mining: concepts, models, methods, and algorithms. John Wiley &Sons, 2011, 550 p.
- Kulikov A.L., Loskutov A.A., Mitrovic M. Improvement of the technical excellence of multiparameter relay protection by combining the signals of the measuring fault detectors using artificial intelligence methods. International Scientific and Technical Conference Smart Energy Systems (SES-2019), 2019, vol. 124. DOI: 1051/e3sconf/201912401039.
- Laruhin A., Nikandrov M., Slavutskii L. Anomalous modes recognizing secondary equipment in electric power industry: adaptive neuro algorithms. In: Proceedings – 2019 International Ural Conference on Electrical Power Engineering (UralCon 2019), 2019, pp. 399–403.
- Moloi K., Akumu A.O. Power distribution fault diagnostic method based on machine learning technique. In: 2019 IEEE PES/IAS PowerAfrica, Abuja, Nigeria, 2019, pp. 238–242. DOI: 10.1109/PowerAfrica.2019.8928633.
- Quintero-Zuluaga J.F. et al. Decision Tree-Based Automated Test-Bed for Performance Validation of Line Protection Relays Using a Hardware-in-the-Loop Architecture. In: 2020 IEEE Colombian Conference on Applications of Computational Intelligence (IEEE ColCACI 2020), Cali, Colombia, 2020, pp. 1–6. DOI: 10.1109/ColCACI50549.2020.9247877.
- Rumelhart D.E., Hinton G.E., Williams R.J. Learning Internal Representations by Error Propagation. Parallel Distributed Processing. Cambridge, MA-MIT Press, 1986, vol. 1, pp. 318–362.
- Samantaray S.R., Kamwa I., Joos G. Ensemble decision trees for phasor measurement unit-based wide-area security assessment in the operations time frame. IET Generation, Transmission & Distribution, 2010, vol. 4(12), 1334–1348. DOI: 10.1049/iet-gtd.2010.0201.
- Sheng Y., Rovnyak S.M. Decision tree-based methodology for high impedance fault detection. In: IEEE Transactions on Power Delivery, 2004, vol. 19, no. 2, pp. 533–536. DOI: 10.1109/TPWRD.2003.820418.
- Slavutskiy A, Slavutskii L., Slavutskaya E. Neural Network for Real-Time Signal Processing: the Nonlinear Distortions Filtering. International Ural Conference on Electrical Power Engineering (UralCon), 2021, pp. 84–88. DOI: 10.1109/UralCon52005.2021.9559619.
Сведения об авторах
Григорьев Александр Тальянович – техник-программист, АО «Научно-производственный комплекс “Элара” имени Г.А. Ильенко», Россия, Чебоксары (sashagrigorev@vk.com).
Кузнецов Никита Алексеевич – студент IV курса, факультет радиоэлектроники и автоматики, Чувашский государственный университет, Россия, Чебоксары (alca@mail.ru).
Славутская Елена Владимировна – доктор психологических наук, профессор кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет имени И.Я. Яковлева, Россия, Чебоксары (slavutskayaev@gmail.com; ORCID: https://orcid.org/0000-0002-3759-6288).
Формат цитирования
Григорьев А.Т., Кузнецов Н.А., Славутская Е.В. Метод «дерево решений» для статистического контроля взаимосвязей параметров многомерных информационных потоков // Вестник Чувашского университета. – 2023. – № 2. – С. 76–84. DOI: 10.47026/1810-1909-2023-2-76-84.
Загрузить полный текст статьи