МЕТОД УСУНЕННЯ АНОМАЛЬНИХ ВИМІРЮВАНЬ ПРИ АНАЛІЗІ БАЗИ БАГАТОВИМІРНИХ ДАНИХ ПІД ЧАС РОЗВʼЯЗАННЯ ЗАДАЧІ ПРИЙНЯТТЯ РІШЕНЬ
DOI:
https://doi.org/10.20998/2222-0631.2021.02.12Ключові слова:
статистичне дослідження, теорія прийняття рішень, аномальні вимірювання, викиди, опукла оболонка, n-вимірний політоп, багатовимірний простірАнотація
У роботі запропоновано метод усунення аномальних вимірювань (викидів) для підвищення рівня якості багатовимірних даних при статистичних дослідженнях. Така проблема виникає, наприклад, в теорії прийняття управлінських рішень, оскільки при обчисленні оцінок параметрів імовірнісних розподілів наявність у вибірці аномальних (тобто таких, що значно збільшують довірчий інтервал) вимірювань здатна спотворити результати статистичного дослідження, а, отже, і основної задачі. Особливість запропонованого метода полягає в тому, що він є комбінацією статистичних та геометричного методів, а саме: методу оцінювання Гествірта, процедури Тьюкі та модифікації метода побудови опуклої оболонки скінченої множини точок багатовимірного простору. Множині багатовимірних даних ставиться у відповідність множина точок багатовимірного простору. Для знаходження і виключення викидів будується послідовність вкладених опуклих оболонок – політопів, кожен з яких описується перетином напівпросторів (опорних гіперграней). Наводиться детальний алгоритм знаходження аномальних вимірювань. Їх виключення відповідає послідовному виключенню граничних точок вкладених опуклих оболонок. Оцінка Гествірта дає умову зупинки роботи алгоритму. Запропонований метод не потребує великих обчислювальних витрат та може широко використовуватися при розв’язанні як теоретичних, так і практичних задач, пов’язаних з обробкою багатовимірних даних. Наведено чисельні результати роботи методу з кількістю компонент даних 4 та 5.
Посилання
Hampel F. R. Robust estimation: a condensed partial survey. Z. Wahrscheinlichkeits – Theorie and Verw. Geb. 1973, no. 27, pp. 87–104.
Polyak B. T., Shcherbakov P. S. Robastnaya ustoychivost' i upravlenie [Robust stability and control]. Moscow, 2002. 303 p.
Shulenin V. P. Matematicheskaya statistika. CH. 3: Robastnaya statistika [Mathematical statistics. Part 3: Robust statistics]. Tomsk, 2012. 520 p.
Efron B. Netraditsyonnye metody mnogomernogo statisticheskogo analiza [Non-traditional methods of multivariate statistical analysis]. Moscow, Finance and statistics Publ., 1988. 261 p.
Gozhiy A. P., Kovalenko I. I. Sistemnoe ispol'zovanie robastnykh i butstrep metodov v zadachakh analiza dannykh [Systematic use of robust and bootstrap methods in data analysis problems]. ASAU, 2006, no. 9 (29), pp. 38–49.
Gastwirth J. On robust procedures. J. Amer. Stat. Assn. 1966, рр. 929–948.
Tukey J. W. A survey of sampling from contaminated distributions. Contributions to probability and statistics. 1960, vol. 2, рр. 448–485.
Huber P. J. Robust statistics : A revier. Ann. Math. Stat. 1972, no. 43(3), рр. 1041–1067.
Preparata F., Sheimos M. Vychislitel'naya geometriya. Vvedenie [Computational geometry. Introduction]. Moscow, 1989. 478 p.
Gil N. I., Sofronova M. S. Ob odnom podkhode k postroeniyu vypukloy obolochki konechnogo mnozhestva tochek v [On an approach to the construction of the convex hull of a finite set of points in Rп]. Shtuchniy іntelekt [Artificial intelligence]. 2009, no. 4, pp. 30–36.
McMullen P., Shephard G. Convex Polytopes and the Upper Bound Conjecture. Cambridge, University Press, 1971.
Pogozhikh M. I., Sofronova M. S. Matematychne modelyuvannya zadach optimіzatsіyi v ekonomіtsі [Mathematical modeling of optimization problems in economics]. Ekonomichna strategiya i perspektyvy rozvytku sfery torgivli ta poslug [Economic strategy and pro-spects for the development of the sphere of trade and services]. Kharkiv, 2017, vol. 1 (25), pp. 121–131.