disertacija
Evaluacija tehnika otkrivanja kontrasta za potrebe selekcije atributa radi klasifikacije

Dijana Oreški (2014)
Sveučilište u Zagrebu
Fakultet organizacije i informatike Varaždin
Podaci o radu
NaslovEvaluacija tehnika otkrivanja kontrasta za potrebe selekcije atributa radi klasifikacije
AutorDijana Oreški
Voditelj/MentorBožidar Kliček (mentor)
Dunja Mladenić (sumentor)
Sažetak rada
Zadnja dva desetljeća ogroman je porast količine podataka koji se pohranjuju u digitalnom formatu. Zahvaljujući današnjim tehnologijama prikupljanje podataka prestaje biti problem, a u fokus zanimanja dolazi njihova analiza i dobivanje vrijednih informacija iz podataka (znanja). Centralno za taj problem je proces otkrivanja znanja u podacima. Proces se sastoji od nekoliko koraka, a priprema podataka koja obuhvaća čišćenje podataka i selekciju atributa oduzima 60% - 95% ukupnog vremena cijelog procesa. Svrha istraživanja je definirati nove tehnike za korištenje u selekciji atributa s ciljem smanjenja vremena potrebnog za provođenje selekcije atributa, a time i otklanjanja uskog grla cjelokupnog procesa otkrivanja znanja u podacima. S tim ciljem definiraju se dvije nove tehnike selekcije atributa koja pripadaju grupi tehnika otkrivanja kontrasta. Predmet istraživanja predstavlja primjena i evaluacija tehnika otkrivanja kontrasta kao tehnika za selekciju atributa. U tu svrhu provodi se opsežno istraživanje s ciljem utvrđivanja na skupovima podataka kojih karakteristika tehnike otkrivanja kontrasta nadmašuju klasične tehnike selekcije atributa, te dobivanja općeg odgovora da li se ubuduće mogu i u kojim situacijama tehnike otkrivanja kontrasta koristiti kao superiorne tehnike selekcije aributa, i mogu li u znatnoj mjeri otkloniti usko grlo cijelokupnog procesa otkrivanja znanja u podacima.Rezultati 1792 analize pokazuju da su u više od 80% analiziranih skupova podataka različitih karakteristika tehnike otkrivanja kontrasta rezultatirale točnijom klasifikacijom i brže provedenim procesom otkrivanja znanja nego dosad korištene tehnike.
Ključne riječirudarenje podataka selekcija atributa tehnike otkrivanja kontrasta klasifikacija karakteristike skupa podataka
Naslov na drugom jeziku (engleski)Evaluation of contrast mining techniques for feature selection in classification
Povjerenstvo za obranuDragan Gamberger (predsjednik povjerenstva)
Božidar Kliček (član povjerenstva)
Dunja Mladenić (član povjerenstva)
Vesna Dušak (član povjerenstva)
Mirko Maleković (član povjerenstva)
Ustanova koja je dodijelila akademski/stručni stupanjSveučilište u Zagrebu
Fakultet organizacije i informatike Varaždin
MjestoVaraždin
Država obraneHrvatska
Znanstveno područje, polje, granaDRUŠTVENE ZNANOSTI
Informacijske i komunikacijske znanosti
Informacijski sustavi i informatologija
UDK004
OPĆENITO
Računalna znanost i tehnologija. Računalstvo. Obrada podataka
Vrsta studijasveučilišni
Stupanjposlijediplomski doktorski
Naziv studijskog programaInformacijske znanosti
Akademski / stručni nazivdoktor/doktorica znanosti, područje društvenih znanosti, polje informacijske i komunikacijske znanosti
Kratica akademskog / stručnog nazivadr.sc.
Vrsta radadisertacija
Jezik hrvatski
Datum obrane2014-02-06
Sažetak rada na drugom jeziku (engleski)
The last two decades there is a huge increase in the amount of data that is stored in digital format. Owing to today's technology data collection ceases to be a problem and in the focus of interest is their analysis and obtaining valuable information from the data (knowledge). Central for this issue is the process of knowledge discovery in data. The process consists of several steps and preparation of the data, which includes data cleaning and feature selection takes away from 60% till 95% total time of the whole process. The purpose of this research is to define new techniques for feature selection in order to reduce the time required to conduct feature selection, and thus removing the bottleneck of the entire process of knowledge discovery in data. For this purpose two new techniques of feature selection are defined, techniques that belong to the group of contrast mining field. The subject of this research is an application and evaluation of contrast mining techniques as a techniques for feature selection.The extensive empirical research is conducted in order to determine data sets characteristics for which contrast mining techniques outperform classical techniques of feature selection, and obtaining general answer can we, and in what kind of data sets, use contrast mining techniques as a superior feature selection techniques, and whether they can eliminate the bottleneck of the entire process of knowledge discovery in data. Results of 1792 analysis showed that in the more than 80% of the analyzed data sets with different characteristics contrast mining techniques resulted with more accurate classification and quickly implemented process of knowledge discovery than previously used feature selection techniques.
Ključne riječi na drugom jeziku (engleski)data mining feature selection contrast mining classification data set characteristis
Verzijaobranjena verzija
Vrsta resursatekst
Prava pristupaRad u otvorenom pristupu
Uvjeti korištenja radahttp://rightsstatements.org/vocab/InC/1.0/
URN:NBNhttps://urn.nsk.hr/urn:nbn:hr:211:337330
PohranioLjiljana Hajdin