Do najważniejszych elementów inteligentnego monitoringu wizyjnego należą moduły odpowiedzialne za modelowanie tła, śledzenie obiektów i ich klasyfikację. Po wyznaczeniu obszarów pierwszego planu, co wyjaśniono w opisie pierwszej części badań, następuje etap śledzenia.
Śledzenie definiowane jest jako proces ustalania położenia obiektów na kolejnych klatkach pozyskanych ze strumienia wideo. Każdy obiekt porusza się po określonej ścieżce zwanej trajektorią ruchu. Informacje na temat ścieżek i sposobu poruszania się mogą stanowić istotne dane dla systemu, służące do analizy zachowań. W przypadku wielu obiektów poruszających się w scenie pomocne jest ich etykietowanie.
Istnieje wiele algorytmów śledzenia, które zakładają płynny sposób poruszania się obiektów oraz brak nagłych zmian prędkości i trajektorii. Takie uproszczenie nie jest do końca poprawne, szczególnie w przypadkach, gdy obiekt porusza się w sposób nieprzewidywalny - niespodziewanie zmienia kierunek ruchu lub zatrzymuje się na dłuższy czas. Na potrzeby projektu systemu SmartMonitor eksperymentalnie sprawdzono różne algorytmy śledzenia, do których należą zarówno te oparte na cechach obrazu (np. Mean-Shift), jak i na modelach matematycznych (filtr Kalmana).
W przypadku algorytmów z rodziny Mean-shift na początku procesu śledzenia wyznaczany jest fragment obiektu (wzorzec), z którego wydzielane są cechy. Na rys. 1 przedstawiono: klatkę z wybranym wzorcem oraz dwie klatki z wynikami śledzenia. W omawianym przypadku za cechę obrano średnią wartość składowej barwnej (H) z modelu HSV. Główną zaletą algorytmu Mean-shift jest jego prostota. Do wad zaliczyć należy bazowanie na wyglądzie, powodujące szereg komplikacji związanych m.in. z lokalizowaniem obiektów o kolorystyce zbliżonej do tła, częściowo zasłoniętych lub zmieniających wygląd.
Rys. 1. Przykładowe rezultaty śledzenia obiektu przy pomocy algorytmu z rodziny Mean-shift.
Wiele z powyższych problemów może zostać rozwiązanych przez zastosowanie filtra Kalmana. Określany jest on przy pomocy modelu matematycznego, a głównym jego zadaniem jest szacowanie przyszłych położeń obiektu na podstawie posiadanych danych. Do poprawnego wykorzystania tego podejścia konieczne jest nałożenie pewnych ograniczeń, m.in. obiekty nie mogą gwałtownie zmieniać kierunku poruszania się. Mimo to proponowane rozwiązanie ma wiele zalet - jest wydajne i proste, a śledzenie opiera się na wyznaczonej pozycji obiektu, a nie jego wyglądzie. Ponadto informacja o przyszłym położeniu obiektu ułatwia jego identyfikowanie i etykietowanie. Rys. 2 przedstawia przykładowy wynik działania filtra Kalmana.
Rys. 2. Przykładowy rezultat działania filtracji Kalmana - czerwone "*" oznaczają pozycje obiektu uzyskane w procesie jego detekcji, zaś zielone "o" to pozycje skorygowane za pomocą filtracji Kalmana.