W sekcji Badania prezentowane będą wybrane rezultaty eksperymentów prowadzonych na potrzeby budowy i testowania prototypu inteligentnego systemu bezpieczeństwa SmartMonitor. Zarówno rysunki, jak i opis słowny mają na celu wyjaśnienie sposobu działania systemu i umożliwienie lepszego poznania jego zalet.
System SmartMonitor będzie działał w czterech podstawowych trybach: zabezpieczenia domu/otoczenia przed niepowołanym wtargnięciem, monitorowania osoby chorej, wykrywania sytuacji niebezpiecznych oraz wykrywania dymu/ognia. Parametry każdego z tych trybów mogą być dostosowywane przez użytkownika, zaś wspólnym ich zadaniem jest analiza sekwencji wideo rejestrowanych przez kamery umieszczone w różnych lokalizacjach. Analiza ta przeprowadzana jest automatycznie przy pomocy różnorodnych metod i algorytmów (analiza treści wizyjnych - ang. Visual Content Analysis, VCA).
W początkowych badaniach poszukiwano rozwiązań, które umożliwią detekcję i lokalizację postaci ruchomych. Najbardziej obiecujące rezultaty uzyskano przy wykorzystaniu algorytmu adaptacyjnego modelowania tła opierającego się na różnych modelach barw. Model tła był wówczas uaktualniany z każdą kolejną klatką sekwencji, a wydzielenie obiektów pierwszego planu sprowadzało się do odjęcia modelu tła od klatki bieżącej. Poniższe rysunki przedstawiają przykładową klatkę wideo (rys. 1), obraz tła dla dwóch modeli barwnych (rys. 2) oraz wydzielone obszary pierwszoplanowe dla dwóch modeli barwnych (rys. 3).
Rys. 1. Przykładowa klatka z sekwencji wideo.
Rys. 2. Modele tła: (a) dla składowej jasności I z modelu YIQ
oraz (b) dla składowej barwy H z modelu HSV.
Rys. 3. Obszary pierwszoplanowe: (a) dla składowej jasności I z modelu YIQ
oraz (b) dla składowej barwy H z modelu HSV.
W monitorowanym obszarze, oprócz obiektów zainteresowania, takich jak ludzie, poruszają się także inne obiekty. Mowa tu o obiektach fałszywych, np. cieniach. Dlatego też kolejnym etapem analizy treści wizyjnej jest dokonanie takich przekształceń, które pozwolą na wydzielenie maski obiektu pierwszoplanowego (rys. 4).
Rys. 4. Maska obiektu pierwszoplanowego.
Taki obraz binarny poddawany jest następnie dalszemu przetwarzaniu, np. rozpoznawaniu kształtu czy klasyfikacji.