Avicon

Kamera 3D – Time-of-Flight (ToF)

Obrazy przestrzenne

Zdolność widzenia przestrzennego jest niezwykle istotna dla ludzi, i tu pojawia się pytanie. Dlaczego większość kamer pokazuje płaski obraz zamiast dużo bardziej naturalnego dla człowieka obrazu w trzech wymiarach? Aby odpowiedzieć sobie na to pytanie należy przeanalizować historię tego jak ludzie próbowali odwzorować głębię w obrazach. Pierwszą metodą jaka została opanowana i do dziś jest używana to metoda stereografii gdzie obserwując dwoma kamerami jedną scenę uzyskiwany był efekt głębi przestrzennej. Cyfrowe przetwarzanie obrazu pozwoliło na uzyskanie lepszej metody, dzięki połączeniu dwóch zdjęć w jedno i taką manipulację kolorów aby w specjalnych okularach z jednym szkłem niebieskim, a drugim czerwonym każde z oczu widziało inny obraz. Obecnie w kinach stosuje się technologię IMAX dzięki odpowiedniej polaryzacji obrazu i soczewek w okularach zapewnia płynny oraz przestrzenny obraz. Wszystkie te technologie specjalnie spreparowanych obrazów o dużo większych wymaganiach niż obrazy w dwóch wymiarach, prowadzi to nas do konkluzji że rejestracja obrazów w 3D wymaga dużo bardziej skomplikowanych procesów niż akwizycja w dwóch wymiarach. Bardziej skomplikowane procesy wymagają więcej zasobów, bardziej zaawansowanych technologii oraz interpretacji większej ilości danych przez co kamery przeznaczone do akwizycji 3D są zazwyczaj droższe i bardziej skomplikowane w użytkowaniu. Obraz w dwóch wymiarach zapewnia również wierniejsze oddanie struktur i kolorów. Czy powoduje to, że kamery 3D są niepotrzebna ciekawostką? Nic bardziej mylnego. Dzisiejszy dążący do automatyzacji świat kreuje zapotrzebowanie na systemy widzących przestrzennie. Samochody sterowane przez sztuczną inteligencję czy maszyny pakujące to jedne z przykładów zastosowań. A ich ilość ciągle rośnie. Z tego powodu powstał szereg technologii pozwalających kamerom na akwizycję obrazu 3D które pozwalają idealnie dobrać kamerę do zastosowania.

Technologie akwizycji obrazu 3D

Technologie akwizycji obrazu 3D znacznie różnią się od siebie pod względem i reprezentują całkowicie inne zalety. Wspomniane wcześniej obrazy przestrzenne zostały uzyskane za pomocą metody stereowizji. Metoda ta używa danych z dwóch obrazów kamer i za pomocą algorytmu łączy ten sam punkt w przestrzeni z dwóch zdjęć.Dzięki temu i znajomości wzajemnego położenia kamer możliwa jest odtworzenie głębi obrazu.Technologia ta jest niemal identyczna z tym co odbywa się podczas naszego procesu widzenia, co przedstawia szereg zalet takich jak możliwość osiągnięcia wysokiej precyzji dla krótkich dystansów czy możliwość wykorzystania dwóch kamer 2D zamiast kamery 3D. Metoda ta wymaga jednak skomplikowanych algorytmów oraz precyzyjnej metody pobierania obrazów. Sprawia to że stereowizja jest droga, złożona w obsłudzę i trudna w zastosowaniach do aplikacji wymagających pracy w czasie rzeczywistym. Całkowicie innym podejściem do rejestracji obrazu przestrzennego jest metoda triangulacji laserowej. W technologii wykorzystywane jest światło lasera które odbijając się od obserwowanego obiektu trafia do kamery. Kąt pod którym zarejestrowane jest światło lasera pozwala obliczyć w jakiej odległości od kamery znajduję się obiekt. Technologia ta jest wprost idealna do zastosowań gdzie chcemy poznać dokładną odległość obserwowanego obiekty od kamery jednak aby taki system działał poprawnie wymaga on wysokiej jakości komponentów. System wymaga niemal niezmienionych warunków pracy,obiekt nie może poruszać się zbyt szybko ani też być w dużej odległości od kamery. Mając na uwadzę wady poprzednich systemów firma Basler stworzyła kamery w oparciu o technologię ToF (Time of flight). Technologia ta w odróżnieniu od poprzednich nie wymaga całych systemów pomiarowych, a jednego kompaktowego urządzenia. Tylko pytanie jak to działa?

Zasada działania Kamer ToF

Metoda ToF wykorzystuje zintegrowane z kamerą źródło modulowanego światła które odbija się od obserwowanego obiektu i jest rejestrowana przez sensor. Brzmi to bardzo podobnie do metody triangulacji laserowej jednak tutaj  oparta jest na całkowicie innej zasadzie. Metoda dzieli się ze względu na tryb pracy oświetlacza na ciągłą bądź pulsacyjną. W ciągłej metodzie ToF badane jest przesunięcie w fazie między falą świetlną z oświetlacza i tą którą odczytał sensor co pozwala wyliczyć odległość od obiektu. W wykorzystywanej w kamerach ToF Baslera metodzie pulsacyjnej jednostka kontrolna migawki synchronizuje akwizycję ramek z impulsami świetlnymi pozwalając jedynie części światła wysyłanego przez oświetlacza na dotarcie do sensora. Aby to sobie zwizualizować można użyć analogii gdzie każdy piksel jest państwem a światło oświetlacza ciężarówką jadącą za granicę. Jazda ciężarówki do celu(tutaj obiekt obserwowany) i z powrotem zajmuje pewien czas. Państwo w tym czasie zamyka jednak granice i część z ciężarówek nie może powrócić. Znając czas po jakim od wysłania ciężarówek zamknięto granice (z założeniem że wszystkie jechały z identyczną prędkością) można ustalić czy miejsce do którego podróżowała ciężarówka było bliżej czy dalej niż odległość która wynika z iloczynu prędkości ciężarówki i czasu który upłynął podzielonego przez dwa. Zmieniając czas po którym zamykana jest granica można dostawać coraz więcej informacji na temat odległości miejsc docelowych. Tak samo migawka blokuje dostęp światłu odbitemu od obiektu który był w odległości większej niż iloczyn prędkości światła w powietrzu oraz czas od impulsu świetlnego do zamknięcia migawki podzielonego przez dwa.Następnie po wielokrotnym zmianie czasu działania migawki sumowane są sygnały które dotarły do sensora i po ilości światła która do niego dotarłą można wyznaczyć jakiego czasu potrzebowało światło aby dotrzeć do każdego piksela sensora a tym samym stworzyć siatkę punktów tworzącą model przestrzenny obserwowanego obiektu. Wydaje się to skomplikowane, jednak jest to najprostsza i najbardziej dostępna z wszystkich metod akwizycji obrazu 3D. Świetnym dowodem o skuteczności i łatwości zastosowania  tej technologii jest to że urządzenie z niej korzystające sprzedało się w milionach egzemplarzy i do dziś dzień jest używane. Urządzeniem tym jest kamera kinect do Xboxa 360, a obecnie zaczyna pojawiać się także w smartfonach. 

Zalety i wady kamer ToF

Kamery ToF zdecydowanie wyróżniają się na tle konkurencji w akwizycji 3D swoją wygodą użytkowania i przystępnością cenową jednak nie jest to rozwiązanie idealne i posiada wiele wad. Zdecydowanie największa wada wynikająca z tego że do obrazowania wykorzystywane są fale świetlne powracające do sensora jest to że  każde inne światło obecne w przestrzeni roboczej kamery będzie negatywnie wpływać na dokładność pomiaru. 

Kamery te mogą mieć również problemy z modelowaniem obiektów błyszczących lub odbijających światło. Jednak wada ta może być również zaletą. Kamery te nie potrzebują dodatkowych oświetlaczy co do niektórych zastosowań stanowić będzie znaczne ograniczenie kosztów. Posiadają również największe możliwości jeśli chodzi o obrazowanie dużych przestrzeni z wszystkich wymienionych technologii,są również od nich o wiele szybsze. Dlatego dają dużo większe możliwości jeśli mają być stosowane w czasie rzeczywistym. 

Kamera Basler blaze

Odpowiadając na zapotrzebowanie rynku na przystępne cenowo dokładne kamery wykorzystujące obrazowanie w trzech wymiarach firma Basler stworzyła kamery Basler Blaze wykorzystującą technologię ToF. Kamera została wyposażona w diodę VCSEL która pozwala na pracę kamery w świetle dnia,zintegrowany czujnik Sony DepthSense ™ IMX556PLR-C z pikselami CAPD (Current Assisted Photonic Demodulator) oraz matrycą Back-Illuminated CMOS. Pozwala mu to na przeprowadzanie dokładnych pomiarów 3D w odległości nawet do 10 metrów. Kamera zapewnia obraz w 30 klatkach na sekundę w rozdzielczości VGA pozwalając na dokładne wizualizacje badanego modelu. Blaze posiada klasę odporności IP67, a dodatkowo niska masa i brak ruchomych elementów sprawiają, że idealnie nadaje się do montażu na ramieniu robota. Interfejs Gigabit Ethernet ułatwia integrację i umożliwia bezproblemowe wykorzystywanie w systemach wielokamerowych bez powodowania wzajemnych zakłóceń. Dodatkowym plusem tej kamery jest to że mimo że kamera pracuje w czerni i bieli możliwa jest łatwa integracja z kamerą 2D Basler ace co pozwala na uzyskanie kolorowego modelu.

Kamery ToF czy kamery 2D

Czy w mojej aplikacji lepsza jest kamera 2D czy 3D? Odpowiedź na to pytanie zależy w znacznej mierze od tego jakich pomiarów lub inspekcji dokonywać będzie kamera. Kamery 2D  mają o wiele lepsze osiągi jeśli chodzi o oddanie koloru,teksture, czy wymiary i kształt płaskich obiektów. Jeżeli zaś chodzi o kamery 3D świetnie sprawdzą się przy analizie pojemności, kształt całego elementu czy jego położenie w 3 wymiarach. Czyli doskonale sprawdzi się w zadaniach logistycznych takich jak paletowanie czy precyzyjna praca robotycznego ramienia. Zdecydowaną przewagę nad kamerami pracującymi w dwóch wymiarach prezentuje także w medycynie gdzie pozwala precyzyjnie ustawić pacjenta do badania czy zdalnie monitorować ruch pacjentów. Jeśli zaś koszt ma mniejsze znaczenie zawsze można użyć systemu dwukamerowego takiego jak dostępny u Baslera zestaw Basler blaze i Basler ace które pozwalają korzystać z zalet obu rozwiązań.