Klasifikační kaskáda

7.1 Systémy založené na učení

Koncept učení pochází z teorie rozpoznávání vzorů a počítačového učení. Lze jej zdatně využít pro vývoj počítačových aplikací, které se mohou autonomně učit a provádět předpovědi na základě nových dat. Takové studie se chovají jinak než metody učení založené na neuronovém učení, v nichž se váhy přizpůsobují, zatímco funkce jsou víceméně pevné. Studie diskutované v této části se chovají spíše jako extraktory příznaků, které pomáhají klasifikátoru při trénování. Aby nedocházelo k překrývání s dříve diskutovanými přístupy, jsou uvažovány pouze metody extrakce příznaků a metody trénování klasifikátoru. Pro trénování klasifikátoru byla pro detekci a sledování objektů ve videích použita řada metod, například Adaboost, Support Vector machines nebo jejich kombinace. Hybridní modely založené na algoritmu Adaboost a konvoluční neuronové síti navrhl Gao a kol. pro počítání osob na základě detekce hlav. Obecná myšlenka použití algoritmu Adaboost spočívala v extrakci oblastí hlavy pro CNN, což může výrazně zkrátit dobu klasifikace. Klasifikátor AdaBoost-SVM má schopnost odstranit omezení tradičního kaskádového-Adaboost klasifikátoru a také snížit časovou náročnost strojů s podpůrnými vektory při použití na rozsáhlé soubory trénovacích vzorků. Výzkum Chenga a kol. použil klasifikátor AdaBoost-SVM pro detekci chodců ve videích. Navrhovaný klasifikátor dokáže automaticky vybrat AdaBoost klasifikátor nebo SVM pro vývoj kaskádového klasifikátoru s ohledem na trénovací vzorky pro zlepšení klasifikačního výkonu. V podobné studii použil Guo et al. klasifikátor AdaBoost-SVM pro detekci chodců ve videích. Navržený model pracoval ve dvou fázích: První fáze se zabývá segmentací kandidátů na chodce ze snímků pomocí algoritmu AdaBoost a kaskádové metody. Druhá fáze se zabývá vyhodnocením, zda je kandidát chodec, nebo ne. Ve druhé fázi byl pro trénování klasifikátoru chodců použit stroj s podpůrnými vektory. Nakonec byla metoda detekce chodců vyhodnocena ve srovnání s tradičním jednostupňovým klasifikátorem, jako je klasifikátor založený na AdaBoost nebo SVM. Bylo zjištěno, že je účinnější než oba. V poslední době nabývají v oblasti detekce a sledování objektů ve videích na významu studie založené na využití strojů s podpůrnými vektory. Zhang a kol. navrhli hybridní model pro sledování objektů ve videích, kde byla využita prostorová omezení pomocí regresního modelu. Metoda použila tři různé stroje podpůrných vektorů pro vývoj trackeru a hybridní stroje podpůrných vektorů byly kombinovány pomocí distribuované strategie. Experimenty s touto technikou ukázaly, že navržený přístup byl lepší než nejnovější stav techniky. Algoritmus pro sledování objektů ve videích založený na podpůrném vektorovém stroji navrhli Cyganek a kol. a . Použili klasifikátor SVM jedné třídy se sledovačem středního posunu. Příznakový vektor byl sestaven ze složek ortogonálního barevného prostoru IJK a strukturního tenzoru. V navržené metodě byl strukturální tenzor vyhodnocen v oblastech pixelů, aby se získaly informace týkající se změn intenzity. Výstup SVM byl po tréninku pomocí těchto rysů změkčen a byl vložen do sledovače středního posunu. Podle studie v , byl zaveden rámec pro učení více pohledů pomocí strojů s více podpůrnými vektory pro sledování objektů ve videích. Metoda byla zkonstruována na základě zohlednění více pohledů na funkce, jako je hodnota stupnice šedi, histogram orientovaných gradientů (HOG) a lokální binární vzor (LBP). Tyto rysy byly použity k trénování strojů podpůrných vektorů. K učení změn v objektu a scénáři bylo zavedeno schéma aktualizace založené na strategii evoluce podprostoru.

Učení reprezentací je soubor technik, ve kterých učení rysů pomáhá snadno extrahovat potřebné informace při konstrukci klasifikátorů nebo prediktorů. Autoři v rámci této kategorie využili metody založené na hlubokém učení, učení příznaků a shlukování. Většina literatury v oblasti reprezentačního učení využívá hluboké učení pro detekci a sledování objektů ve videích. Su a kol. použili metodu učení příznaků založenou na řídkém autoenkodéru (SAE) k řešení problému extrakce hloubkových příznaků pro detekci lidského těla ve videích. SAE je nekontrolovaná metoda sklonění příznaků, která se může vyhnout pracnému a ručnímu návrhu příznaků. Navrhovaná metoda využívá konvoluční neuronovou síť a pooling ke snížení složitosti trénování SAE. Byla navržena strategie lokalizace pomocí posuvného okna, ve které byl histogram hloubky použit k vytvoření středu kandidátního detekčního okna. Metoda dále využívala vztah mezi výškou lidského těla a hloubkou k vyhodnocení velikosti detekčního okna. Přístup založený na reprezentaci pomocí shlukování použil Jia a kol. pro detekci osoby kotvy ve zpravodajské videosekvenci. Zpočátku byla nová videa rozdělena na záběry a následně byly z každého záběru extrahovány klíčové snímky pro reprezentaci zpravodajského videa. Dále byla použita statistická vzdálenost Pearsonova korelačního koeficientu k provedení shlukování klíčových snímků a záběry s kotvou byly detekovány pomocí kritérií pro záběry s kotvou

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.