Jedną z dziedzin machine learningu, którą zajmujemy się w Whiteaster jest rozpoznawanie obrazów i obiektów 3D. W jaki sposób tworzy się taką technologię i w jakich branżach wykorzystuje się rozpoznawanie obrazu?
Jak działa technologia rozpoznawania obrazu?
Pierwszym etapem jest pozyskanie obrazu. Potem następuje analiza i określenie cech obrazu. To bardzo ważny etap, gdyż algorytmy opisu obrazu nie mogą (na ogół) zmagać się z milionami pikseli składającymi się na oryginalny obraz, tylko muszą dostać wygodną do interpretacji reprezentację obrazu w postaci pojedynczego punktu w przestrzeni cech.
Kolejnym etapem jest znalezienie właściwego opisu obrazu w postaci odpowiednio dobranej formuły matematycznej. Na koniec następuje właściwe rozpoznanie obrazu i związana z nim decyzja.
Jest to klasyczne podejście do tematu rozpoznawania klasyfikacji obrazów. Aktualnie stosuje się model sieci konwolucyjnych, gdzie selekcja cech istotnych dokonuje się sama na etapie uczenia tej sieci (sieć uczy się sama selekcji cech i ich klasyfikacji).
Gdzie przydaje się rozpoznawanie obrazu?
Rozpoznawanie twarzy w przestrzeni publicznej
Użycie systemów znajduje zastosowanie na przykład w sklepach, wykorzystując kamery przemysłowe, by zminimalizować straty związane z drobnymi kradzieżami, rozpoznając twarze osób, wcześniej zamieszanych w kradzieże. Podobne systemy wykorzystuje się na lotniskach, gdzie systemy są w stanie wykryć twarze osób, które z różnych względów nie powinny wejść na pokład.
Augmented reality, czyli rozszerzona rzeczywistość
System umożliwiałby rozpoznanie budynku, któremu użytkownik robi zdjęcie, poprzez wysłanie serwerowi danych geolokacyjnych z wbudowanego odbiornika GPS wraz ze zrobionym zdjęciem. Serwer robi listę obiektów, które znajdują się w pobliżu i porównuje je z nadesłanym zdjęciem. Następnie rozpoznaje obiekt i przesyła informacje o nim z powrotem do urządzenia.
E-commerce
Aplikacje mobilne umożliwiające zrobienie zdjęcia produktom i automatyczny zakup ich w sklepie online.
Warto pamiętać, że to tylko niektóre branże i sektory, w których rozwijana jest technologia automatycznego rozpoznawania obrazów. Sztuczna inteligencja będzie niebawem dominować w niemal wszystkich dziedzinach życia.
Nie tylko rozpoznawanie obrazu. Czego można nauczyć maszynę?
Maszyny uczą się także dźwięków (m.in. mowy), chorób (w celu wspomagania diagnostyki medycznej), sytuacji ekonomicznej (w celu optymalizacji decyzji finansowych), formacji geologicznych (w celu znajdowania nowych złóż surowców), czy nastrojów społecznych (w celu przewidywania wyników wyborów)