АВТОМАТИЧНА ІДЕНТИФІКАЦІЯ МУЗИЧНИХ ІНСТРУМЕНТІВ
DOI:
https://doi.org/10.20998/2222-0631.2025.02(9).08Ключові слова:
перетворення Фур’є, спектральні характеристики, кепстральні коефіцієнти Mel-Frequency, аналіз сигналів, обробка аудіо, машинне навчання, метод опорних векторів, метод найближчого сусідаАнотація
У цій статті досліджується застосування перетворення Фур’є для автоматичного розпізнавання музичних інструментів в аудіозаписах. Зі
зростанням складності музичних композицій та потребою в ефективній класифікації аудіо дослідження зосереджується на вилученні детальних спектральних характеристик із звукових сигналів за допомогою швидкого перетворення Фур’є (FFT). Ці характеристики включають спектральний центроїд, ширину смуги пропускання, спад, швидкість перетину нуля та кепстральні коефіцієнти Mel-Frequency (MFCC), які представляють частотні характеристики різних інструментів. Вилучені характеристики обробляються та використовуються для навчання моделей машинного навчання. Зокрема, у статті оцінюється продуктивність двох алгоритмів класифікації: методу апроксимації найближчого сусіда (ANN) та методу опорних векторів (SVM). Моделі навчаються на наборі даних коротких записів на одному інструменті та тестуються на зразках зі змішаних інструментів для оцінки можливостей узагальнення. Експериментальні результати показують, що обидві моделі можуть ефективно класифікувати інструменти з високою точністю – понад 96 % у контрольованих середовищах. Однак точність знижується у складних поліфонічних записах через перекриття частот. У дослідженні також підкреслюється роль таких бібліотек як Librosa, Numpy та Scikit-learn для попередньої обробки та навчання моделей. Результати дослідження показують, що хоча запропонований підхід не ідеально підходить для визначення інструментів в оркестрах, він є дуже ефективним у класифікації сольних інструментів і може бути поширений на такі завдання, як розпізнавання жанрів. Майбутні дослідження можуть включати методи глибинного навчання та розділення джерел звуку для покращення продуктивності в поліфонічних умовах.
Посилання
Zabolotniy S. V. Tsyfrove obroblennya sygnaliv : posibnyk dlya studentiv napryamu pidgotovky 6.050901 "Radiotekhnika" usikh form navchannya [Digital signal processing: A manual for students of the direction of training 6.050901 "Radio engineering" of all forms of study]. Cherkasy, ChDTU, 2010. 119 p.
Digital Signal Processing A Practical Guide for Engineers and Scientists by Steven W. Smith. Library of Congress Cataloging-in-Publication Data.
Jiang Dan-Ning, Lu Lie, Zhang Hong-Jiang, Tao Jian-Hua, Cai Lian-Hong. Music type classification by spectral contrast feature In Proceedings. IEEE International Conference on Multimedia and Expo. 2002, pp. 113–116.
Tzanetakis G., Cook P. Musical genre classification of audio signals. In IEEE Transactions on Speech and Audio Processing. 2002, pp. 293–302.
Ivanenko A., Shatyrko A. Application for detecting musical instruments in an orchestra. MSTIoE 2024-11. 11-ta Skhidno-Evropeys'ka konferentsiya "Matematychni ta programni tekhnologiyi Internet of Everything" (11 – 12.04.2024, Кyiv) [MSTIoE 2024-11. 11-та Східно-Европейська конференція «Математичні та програмні технології Internet of Everything» (11 – 12.04.2024, Кyiv)]. Кyiv, 2024, pp. 48–49.
José Unpingco. Python for Signal Processing. San Diego, CA, USA, Springer Cham Heidelberg New York Dordrecht London. DOI 10.1007/978- 3-319-01342-8.
Lerch Alexander. An Introduction to Audio Content Analysis: Applications in Signal Processing and Music Informatics. IEEE Press/Wiley. 2012. DOI 10.1002/9781118393501.