Článek v časopise

HLOSTA Martin, STRÍŽ Rostislav, KUPČÍK Jan, ZENDULKA Jaroslav a HRUŠKA Tomáš. Constrained Classification of Large Imbalanced Data by Logistic Regression and Genetic Algorithm. International Journal of Machine Learning and Computing. Singapore: of Computer Science and Information Technology Press, 2013, roč. 2013, č. 3, s. 214-218. ISSN 2010-3700. Dostupné z: http://www.ijmlc.org/index.php?m=content&c=index&a=show&catid=36&id=304
Jazyk publikace:angličtina
Název publikace:Constrained Classification of Large Imbalanced Data by Logistic Regression and Genetic Algorithm
Název (cs):Klasifikace rozsáhlých nevyvážených dat pomocí logistické regrese a genetického algoritmu s omezujícími podmínkami
Strany:214-218
Místo vydání:SG
Rok:2013
URL:http://www.ijmlc.org/index.php?m=content&c=index&a=show&catid=36&id=304
Časopis:International Journal of Machine Learning and Computing, roč. 2013, č. 3, Singapore, SG
ISSN:2010-3700
URL:http://www.ijmlc.org/papers/305-K0018.pdf [PDF]
Klíčová slova
Nevyvážená data, klasifikace, genetický algoritmus, logistická regrese
Anotace
Klasifikace nevyvážených dat je často diskutovaný problém, který nelze řešit běžnými klasifikačními technikami. V článku jsme se zabývali problémem binární klasifikace z rozsáhlých dat s omezením na minoritní třídu. Přestavujeme novou meta-učící metodu, která vytváří kandidátní modely pomocí cost-sensitive učení logistické regrese a tyto modely využívá jako počáteční chromozomy pro optimalizaci genetickým algoritmem. Tato metoda byla úspěšně testována na rozsáhlých datech z reálného prostředí z výzkumu v oblasti počítačové bezpečnosti. Experimenty dokazují, že kombinovaná metoda vede vždy k lepším výsledkům než použití metod logistické regrese a genetického algoritmu samostatně. Navíc, tato metoda produkuje snadno interpretovatelný klasifikační model, který poskytuje velmi rychlou klasifikaci nad neznámými daty.
BibTeX:
@ARTICLE{
   author = {Martin Hlosta and Rostislav Str{\'{i}}{\v{z}} and
	Jan Kup{\v{c}}{\'{i}}k and Jaroslav Zendulka and
	Tom{\'{a}}{\v{s}} Hru{\v{s}}ka},
   title = {Constrained Classification of Large Imbalanced
	Data by Logistic Regression and Genetic Algorithm},
   pages = {214--218},
   journal = {International Journal of Machine Learning and Computing},
   volume = 2013,
 number = 3,
   year = 2013,
   ISSN = {2010-3700},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php.cs?id=10277}
}

Vaše IPv4 adresa: 34.238.189.171
Přepnout na https