7.1 Oppimiseen perustuvat järjestelmät
Oppimisen käsite on peräisin hahmontunnistuksesta ja laskennallisesta oppimisteoriasta. Sitä voidaan käyttää pätevästi sellaisten tietokonesovellusten kehittämiseen, jotka voivat itsenäisesti oppia ja tehdä ennusteita uuden datan perusteella. Tällaiset opinnot käyttäytyvät eri tavalla kuin neuraalipohjaiset oppimismenetelmät, joissa painot mukautuvat, kun taas piirteet ovat enemmän tai vähemmän kiinteitä. Tässä jaksossa käsiteltävät tutkimukset käyttäytyvät pikemminkin kuin ominaisuuksien poimijat, jotka auttavat luokittimen harjoittelussa. Jotta vältyttäisiin päällekkäisyyksiltä aiemmin käsiteltyjen lähestymistapojen kanssa, tarkastellaan vain ominaisuuksien poimintamenetelmiä ja luokittelijan koulutusmenetelmiä. Luokittelijan kouluttamiseen on käytetty lukuisia menetelmiä, kuten Adaboostia, tukivektorikoneita tai niiden yhdistelmiä, objektien havaitsemiseen ja seurantaan videoissa. Gao et al. ovat ehdottaneet Adaboost-algoritmiin ja konvoluutiohermoverkkoon perustuvia hybridi-malleja ihmisten laskemiseen päiden havaitsemisen perusteella. Adaboost-algoritmin käytön yleisenä ideana oli poimia pääalueet CNN:ää varten, mikä voi merkittävästi lyhentää luokitteluaikaa. AdaBoost-SVM-luokittimella pystytään poistamaan perinteisen kaskadi-Adaboost-luokittimen rajoitukset ja vähentämään tukivektorikoneiden ajankäyttöä, kun sitä sovelletaan laajoihin harjoitusnäytejoukkoihin. Chengin ym. tutkimuksessa sovellettiin AdaBoost-SVM-luokitinta jalankulkijoiden havaitsemiseen videoista. Ehdotettu luokittelija voi valita AdaBoost-luokittimen tai SVM-luokittimen automaattisesti kaskadiluokittimen kehittämiseksi harjoitusnäytteiden suhteen luokittelutuloksen parantamiseksi. Samankaltaisessa tutkimuksessa Guo et al. on käyttänyt AdaBoost-SVM-luokittelijaa jalankulkijoiden havaitsemiseen videoissa. Ehdotettu malli toimi kahdessa vaiheessa; ensimmäinen vaihe käsittelee jalankulkijakandidaattien segmentointia kuvista AdaBoost-algoritmin ja kaskadimenetelmän avulla. Toisessa vaiheessa arvioidaan, onko ehdokas jalankulkija vai ei. Toisessa vaiheessa käytettiin tukivektorikonetta jalankulkijoiden luokittelijan kouluttamiseen. Lopuksi jalankulkijoiden tunnistamismenetelmää arvioitiin verrattuna perinteiseen yksivaiheiseen luokittimeen, kuten AdaBoost-pohjaiseen tai SVM-pohjaiseen luokittimeen. Sen todettiin olevan tehokkaampi kuin molemmat. Tukivektorikoneiden käyttöön perustuvat tutkimukset ovat viime aikoina kasvattaneet merkitystään videoiden objektien havaitsemisen ja seuraamisen alalla. Zhang et al. ehdottivat hybridi-mallia objektien seurantaan videoissa, jossa alueellisia rajoitteita hyödynnettiin regressiomallin avulla. Menetelmässä käytettiin kolmea erilaista tukivektorikonetta seurantalaitteen kehittämiseen ja hybridi-tukivektorikoneita yhdistettiin hajautetun strategian avulla. Tätä tekniikkaa koskevat kokeet osoittivat, että ehdotettu lähestymistapa oli parempi kuin uusin tekniikka. Cyganek et al. ja ehdottivat tukivektorikoneeseen perustuvaa algoritmia objektien seurantaan videoissa. He olivat käyttäneet yhden luokan SVM-luokittelijaa, jossa oli keskiarvonsiirtymäseuranta. Ominaisuusvektori muodostettiin ortogonaalisen IJK-väriavaruuden komponenteista ja rakenteellisesta tensorista. Suunnitellussa menetelmässä rakenteellinen tensori arvioitiin pikselialueilla intensiteetin vaihteluun liittyvän tiedon keräämiseksi. SVM:n tuotos näiden ominaisuuksien avulla suoritetun harjoittelun jälkeen pehmennettiin ja syötettiin mean shift trackeriin. Tutkimuksen mukaan osoitteessa esiteltiin usean näkymän oppimiskehys, jossa käytettiin useita tukivektorikoneita objektien seurantaan videoissa. Menetelmä rakennettiin ottamalla huomioon usean näkymän piirteet, kuten harmaasävyarvo, suuntautuneiden gradienttien histogrammi (HOG) ja paikallinen binäärikuvio (LBP). Näitä ominaisuuksia käytettiin tukivektorikoneiden kouluttamiseen. Aliavaruuden evoluutiostrategiaan perustuva päivitysjärjestelmä otettiin käyttöön kohteen ja skenaarion muutosten oppimiseksi.
Representaatio-oppiminen on joukko tekniikoita, joissa ominaisuuksien oppiminen auttaa poimimaan tarvittavaa tietoa helposti luokittelijoiden tai ennustimien rakentamisen aikana. Kirjoittajat olivat hyödyntäneet syväoppimista, ominaisuuksien oppimista ja klusterointiin perustuvia menetelmiä tässä luokassa. Useimmissa representaatio-oppimisen alaan kuuluvissa julkaisuissa on hyödynnetty syväoppimista objektien havaitsemiseen ja seurantaan videoissa. Su et al. on käyttänyt harvaan autokooderiin (SAE) perustuvaa ominaisuuksien oppimismenetelmää käsitelläkseen syvyysominaisuuksien louhintaongelmaa ihmiskehon havaitsemiseksi videoissa. SAE on valvomaton ominaisuuksien nojausmenetelmä, jolla voidaan välttää työläs ja käsityönä tehtävä ominaisuuksien suunnittelu. Ehdotetussa menetelmässä käytettiin konvoluutiohermoverkkoa ja poolingia SAE:n koulutuskompleksisuuden vähentämiseksi. Ehdotettiin liukuvan ikkunan lokalisointistrategiaa, jossa syvyyden histogrammia käytettiin ehdokkaan havaitsemisikkunan keskipisteen kehittämiseen. Menetelmässä hyödynnettiin lisäksi ihmiskehon korkeuden ja syvyyden välistä suhdetta tunnistusikkunan koon arvioimiseksi. Jia et al. ovat käyttäneet klusterointiin perustuvaa esitysmenetelmää uutisvideosarjan ankkurihenkilön havaitsemiseen. Aluksi uudet videot jaettiin otoksiin, minkä jälkeen jokaisesta otoksesta poimittiin avainkuvat uutisvideon esittämistä varten. Lisäksi Pearsonin korrelaatiokertoimen tilastollista etäisyyttä käytettiin avainkuvioiden klusterointiin, ja ankkurihenkilön otokset havaittiin ankkurikuvauskriteerien avulla.