Please use this identifier to cite or link to this item: http://dspace.snu.edu.ua:8080/jspui/handle/123456789/1856
Title: Підходи до класифікації незбалансованих та зсунутих наборів даних
Other Titles: Подходы к классификации несбалансированных и ассимметричных наборов данных
Approaches for Classification of Imbalanced and Skewed Datasets
Authors: Білобородова, Т.О.
Скарга-Бандурова, І.С.
Белобородова, Т.А.
Скарга-Бандурова, И.С.
Bіloborodova, T.O.
Skarga-Bandurova, I.S.
Keywords: лінійна бінарна класифікація
розрізнювальний
породжувальний
мінімаксний підходи
незбалансовані дані
линейная бинарная классификация
дискриминантный
генеративный
минимаксный подходы
несбалансированные данные
linear binary classification
generative and discriminative classifiers
minimax
biased data
Issue Date: 2017
Publisher: вид-во СНУ ім. В.Даля
Citation: Білобородова Т.О. Підходи до класифікації незбалансованих та зсунутих наборів даних / Т.О. Білобородова, І.С. Скарга-Бандурова // Вісник Східноукраїнського національного університету імені Володимира Даля. – 2017. – № 8 (238). – С. 17 - 24
Abstract: Розглянуто проблему вибору підходу, алгоритму для бінарної класифікації незбалансованих та зсунутих наборів даних. Проаналізовано математичні моделі, виділені властивості кожного з підходів. Проведена класифікація з використанням алгоритмів, що представляють кожен з підходів. Виконана перевірка якості та ефективності моделей з використанням таких показників, як помилки першого та другого роду, частка істинно позитивних та істинно негативних спостережень, чутливість та специфічність побудованих моделей для тестового набору даних. За допомогою Biased Minimax Probability Machine (BMPM), отримані характеристики класифікації даних, що враховують властивості даних. Підтверджено якість мінімаксного підходу до класифікації незбалансованих даних.
Рассмотрена проблема выбора подхода, алгоритма для бинарной классификации с учетом свойств входных данных. Проанализированы математические модели, выделенны свойства каждого из подходов. Проведена классификация с использованием алгоритмов, представляющих каждый из подходов. Выполнена оценка качества и эффективности моделей с использованием таких показателей, как ошибки первого и второго рода, доля истинно положительных и истинно отрицательных наблюдений, чувствительность и специфичность полученных моделей для тестового набора данных. С помощью Biased Minimax Probability Machine (BMPM), полученны характеристики классификации данных, учитывающих свойства данных. Подтверждено качество минимаксного подхода к классификации несбалансированных данных.
The problem of choosing data classification approach taking into account data features is considered. Mathematical models are analyzed, the properties of each approach are highlighted. The estimation of quality and efficiency of models with different indicators as the type 1 and type 2 errors, a share of truly positive and truly negative observations, sensitivity and specificity of the received models for a test data set is carried out. With the Biased Minimax Probability Machine, the data classification characteristics factored in data properties are obtained. The quality of the minimax approach to the classification of unbalanced data has been confirmed.
URI: http://dspace.snu.edu.ua:8080/jspui/handle/123456789/1856
Appears in Collections:№ 8 (238)

Files in This Item:
File Description SizeFormat 
017-024.pdf599,21 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.