Pattern recognition czyli rozpoznawanie obrazu i wzorów

Jedną z dziedzin machine learningu, którą zajmujemy się w Whiteaster jest rozpoznawanie obrazów i obiektów 3D.
W jaki sposób tworzy się taką technologię i w jakich branżach wykorzystuje się rozpoznawanie obrazu?

Jak działa technologia rozpoznawania obrazu?

Pierwszym etapem jest pozyskanie obrazu. Potem następuje analiza i określenie cech obrazu. To bardzo ważny etap, gdyż algorytmy opisu obrazu nie mogą (na ogół) zmagać się z milionami pikseli składającymi się na oryginalny obraz, tylko muszą dostać wygodną do interpretacji reprezentację obrazu w postaci pojedynczego punktu w przestrzeni cech.

Kolejnym etapem jest znalezienie właściwego opisu obrazu w postaci odpowiednio dobranej formuły matematycznej. Na koniec następuje właściwe rozpoznanie obrazu i związana z nim decyzja.

Jest to klasyczne podejście do tematu rozponawania klasyfikacji obrazów. Aktualnie stosuje się model sieci konwolucyjnych, gdzie selekcja cech istotnych dokonuje sie sama na etapie uczenia tej sieci (sieć uczy się sama selekcji cech i ich klasyfikacji).

 

Gdzie przydaje się rozpoznawanie obrazu?

  • Rozpoznawanie twarzy w przestrzeni publicznej

Użycie systemów znajduje zastosowanie na przykład w sklepach, wykorzystując kamery przemysłowe, by zminimalizować straty związane z drobnymi kradzieżami, rozpoznając twarze osób, wcześniej zamieszanych w kradzieże. Podobne systemy wykorzystuje się na lotniskach, gdzie systemy są w stanie wykryć twarze osób, które z różnych względów nie powinny wejść na pokład.

  • Augmented reality, czyli wspomagana rzeczywistość

Warto pamiętać, że to tylko niektóre branże i sektory, w których rozwijana jest technologia automatycznego rozpoznawania obrazów. Sztuczna inteligencja będzie niebawem dominować w niemal wszystkich dziedzinach życia.

  • E-commerce

Aplikacje mobilne umożliwiające zrobienie zdjęcia produktom i automatyczny zakup ich w sklepie online.

rozpoznawanie obrazu i wzorów 3D

 

Nie tylko rozpoznawanie obrazu. Czego można nauczyć maszynę?

Warto pamiętać, że to tylko niektóre branże i sektory, w których rozwijana jest technologia automatycznego rozpoznawania obrazów. Maszyny uczą się także dźwięków (m.in. mowy), chorób (w celu wspomagania diagnostyki medycznej), sytuacji ekonomicznej (w celu optymalizacji decyzji finansowych), formacji geologicznych (w celu znajdowania nowych złóż surowców), czy nastrojów społecznych (w celu przewidywania wyników wyborów).