6 podstawowych rzeczy, które warto wiedzieć o konwolucji
W matematyce, konwolucja jest operacją wykonywaną na dwóch funkcjach (f i g) w celu uzyskania trzeciej funkcji. Konwolucja jest jedną z najważniejszych operacji w przetwarzaniu sygnałów i obrazów. Może działać w 1D (np. przetwarzanie mowy), 2D (np. przetwarzanie obrazu) lub 3D (przetwarzanie wideo).
W przetwarzaniu obrazu, konwolucja jest proces przekształcania obrazu przez zastosowanie jądra nad każdym pikselem i jego lokalnych sąsiadów w całym obrazie. Jądro jest macierzą wartości, których rozmiar i wartości określają efekt transformacji procesu convolution.
Proces Convolution obejmuje następujące kroki. (1)Umieszcza macierz jądra nad każdym pikselem obrazu (zapewniając, że pełne jądro jest w obrębie obrazu), mnoży każdą wartość jądra z odpowiadającym pikselem, nad którym jest. (2)Następnie, sumuje powstałe pomnożone wartości i zwraca wynikową wartość jako nową wartość środkowego piksela. (3) Ten proces jest powtarzany na całym obrazie.
Jak widzimy na rysunku, 3×3 jądro jest convoluted nad 7×7 obrazu źródłowego. Środkowy element jądra jest umieszczony nad pikselem źródłowym. Piksel źródłowy jest następnie zastępowany sumą ważoną samego siebie i otaczających go pikseli. Wynik jest umieszczany w wartości piksela docelowego. W tym przykładzie, na pierwszej pozycji, mamy 0 w pikselu źródłowym i 4 w jądrze. 4×0 to 0, następnie przechodząc do następnego piksela mamy 0 i 0 w obu miejscach. 0x0 jest 0. Potem znowu 0x0 jest 0. Następnie w centrum jest 1 w źródłowym obrazie i 0 w odpowiadającej pozycji jądra. 0x1 jest 0. Następnie ponownie 0x1 jest 0. Następnie 0x0 jest 0 i 0x1 jest 0 i na ostatniej pozycji jest -4×2 co jest -8. Teraz sumując wszystkie te wyniki otrzymujemy -8 jako odpowiedź więc wyjściem tej operacji konwolucji jest -8. Wynik ten jest aktualizowany w Destination image.
Wyjście procesu konwolucji zmienia się wraz ze zmianą wartości jądra. Na przykład, pokazane poniżej jądro Identity, zastosowane do obrazu poprzez konwolucję, nie będzie miało żadnego wpływu na obraz wynikowy. Każdy piksel zachowa swoją oryginalną wartość, jak pokazano na poniższym rysunku.