Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.snu.edu.ua:8080/jspui/handle/123456789/1856
Название: Підходи до класифікації незбалансованих та зсунутих наборів даних
Другие названия: Подходы к классификации несбалансированных и ассимметричных наборов данных
Approaches for Classification of Imbalanced and Skewed Datasets
Авторы: Білобородова, Т.О.
Скарга-Бандурова, І.С.
Белобородова, Т.А.
Скарга-Бандурова, И.С.
Bіloborodova, T.O.
Skarga-Bandurova, I.S.
Ключевые слова: лінійна бінарна класифікація
розрізнювальний
породжувальний
мінімаксний підходи
незбалансовані дані
линейная бинарная классификация
дискриминантный
генеративный
минимаксный подходы
несбалансированные данные
linear binary classification
generative and discriminative classifiers
minimax
biased data
Дата публикации: 2017
Издательство: вид-во СНУ ім. В.Даля
Библиографическое описание: Білобородова Т.О. Підходи до класифікації незбалансованих та зсунутих наборів даних / Т.О. Білобородова, І.С. Скарга-Бандурова // Вісник Східноукраїнського національного університету імені Володимира Даля. – 2017. – № 8 (238). – С. 17 - 24
Краткий осмотр (реферат): Розглянуто проблему вибору підходу, алгоритму для бінарної класифікації незбалансованих та зсунутих наборів даних. Проаналізовано математичні моделі, виділені властивості кожного з підходів. Проведена класифікація з використанням алгоритмів, що представляють кожен з підходів. Виконана перевірка якості та ефективності моделей з використанням таких показників, як помилки першого та другого роду, частка істинно позитивних та істинно негативних спостережень, чутливість та специфічність побудованих моделей для тестового набору даних. За допомогою Biased Minimax Probability Machine (BMPM), отримані характеристики класифікації даних, що враховують властивості даних. Підтверджено якість мінімаксного підходу до класифікації незбалансованих даних.
Рассмотрена проблема выбора подхода, алгоритма для бинарной классификации с учетом свойств входных данных. Проанализированы математические модели, выделенны свойства каждого из подходов. Проведена классификация с использованием алгоритмов, представляющих каждый из подходов. Выполнена оценка качества и эффективности моделей с использованием таких показателей, как ошибки первого и второго рода, доля истинно положительных и истинно отрицательных наблюдений, чувствительность и специфичность полученных моделей для тестового набора данных. С помощью Biased Minimax Probability Machine (BMPM), полученны характеристики классификации данных, учитывающих свойства данных. Подтверждено качество минимаксного подхода к классификации несбалансированных данных.
The problem of choosing data classification approach taking into account data features is considered. Mathematical models are analyzed, the properties of each approach are highlighted. The estimation of quality and efficiency of models with different indicators as the type 1 and type 2 errors, a share of truly positive and truly negative observations, sensitivity and specificity of the received models for a test data set is carried out. With the Biased Minimax Probability Machine, the data classification characteristics factored in data properties are obtained. The quality of the minimax approach to the classification of unbalanced data has been confirmed.
URI (Унифицированный идентификатор ресурса): http://dspace.snu.edu.ua:8080/jspui/handle/123456789/1856
Располагается в коллекциях:№ 8 (238)

Файлы этого ресурса:
Файл Описание РазмерФормат 
017-024.pdf599,21 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.