본문 바로가기



AI 관련 기술들/AI

우리의 눈과 뇌에서 일어나는 시각정보 처리과정

이번 글에서는 우리 눈과 뇌에서 일어나는 시각정보 처리에 대하여 살펴보도록 하겠습니다.

우리 몸이 천냥이라면 그 중에서 눈이 900냥이라는 말이 있습니다.
그만큼 눈이 중요하다는 것을 우리 조상들은 오랜 옛날부터 이야기 해 오고 있었는데요.
실제로 우리가 받아들이는 감각 정보의 77%가 시각정보이며, 따라서 시각정보의 처리 기능은 우리의 뇌가 정보를 받아들이기 위한 가장 핵심이 되는 기능이라고 볼 수 있습니다.

시각정보는 우리의 눈에서 시작하여 시신경을 통해 뇌까지 흘러가면서 다양한 처리 과정을 거치게 됩니다.
대표적으로 눈과 망막, 시신경, 뇌의 세 부분으로 구분되어 처리되고 있습니다.
그럼 먼저 눈과 망막의 구조와 눈과 망막에서 처리되는 내용부터 살펴보도록 하겠습니다.
아래의 그림을 보시죠.

 

눈과 망막의 구조


빛이 들어오는 양을 조절하기 위한 홍채와 홍채의 상태에 따라 변한 동공, 입사광을 굴절시켜 상을 맺히게 하기 위한 수정체유리체, 수정체의 굴절률을 조절하기 위한 모양근, 상이 맺히고 입사광의 정보를 인식하기 위한 영역인 망막, 망막에서 인식된 정보를 뇌까지 보내기 위한 시신경 등 다양한 기능을 가진 영역으로 구분되어 있습니다.

이 중에서 시각정보를 처리하기 위하여 중요한 영역은 망막과 시신경입니다.
그림에서 볼 수 있듯이 망막은 안구를 보호하며 빛을 수용하여 전기신호를 발생할 수 있도록 다양한 일을 수행하는 망막상피세포(색소상피, 색소세포)층, 인식된 빛을 전기신호로 변환하여 전달하기 위한 시신경섬유로 구성된 시신경층(광수용세포층)과 이를 신경절 세포층으로 전달하기 위한 쌍극세포층, 쌍극세포를 통해서 전달받은 시신경의 신호를 뇌로 전달하기 위하여 신경섬유로 내보내는 신경절 세포층으로 구성되어 있습니다.

 

안구에서 시각정보를 시신경을 통해 전달하는 신경절세포는 망막의 처리결과에 대한 마지막 출력에 해당하는 영역으로 뉴런과 동일한 방식으로 동작하며 망막에서 전기신호로 변환된 시각정보는 신경절 세포의 반응률에 영향을 미칩니다.

신경절 세포의 반응률에 영향을 미치는 망막표면의 영역을 해당 세포의 수용영역(Receptive Field, 수용야 또는 감수영역이라고도 부름)이라고 하며 "중심흥분 + 주변억제"와 "중심억제 + 주변흥분"의 두 가지 형태가 존재합니다.

 

 

그림에서 보시는 것처럼 수용영역이 우리가 바라보고 있는 시각 범위에서 어떤 영역으로 포함되는가에 따라서 흥분과 억제 상태가 결정됩니다.

시신경층을 구성하고 있는 간상세포, 원추세포와 같은 각각의 시신경 세포들의 흥분과 억제 상태가 서로 교차하면서 입력된 자극에 대하여 선택적인 반응을 일으키고 이러한 반응에 따라 경계 영역이 발생하게 됩니다.

이런 방식으로 윤곽선에 대한 정보를 생성, 즉 입력되는 빛에 대한 형태를 인식할 수 있게 됩니다.

그리고 이렇게 생성된 정보를 전달받은 신경절 세포에서 나온 신경섬유들이 모여 맹점을 통해 안구를 빠져나가서 뇌로 연결이 됩니다.

 

맹점을 통해서 빠져나온 시신경은 망막과 뇌의 시각피질을 중계해주는 외측슬상체로 전달되는데 외측슬상체에서 시신경과 뇌의 뉴런이 시냅스로 연결되죠.

외측슬상체는 좌측과 우측으로 나뉘어 시각 교차 등을 처리하여 양안시가 가능하도록 해 줍니다.

외측슬상체를 거친 시각정보는 시각피질로 들어가게 되는데 시각피질은 단순세포, 복합세포, 초복합세포로 구성되어 있으며, 이렇게 구성된 첫번째 시각피질을 1차 시각피질이라고 부르고 V1으로 표시하는데 총 V7까지 올라가게 되죠.

 

시각피질을 구성하는 3종류의 세포들 중에서 단순세포는 점, 막대, 모서리와 같은 사물 형태의 윤곽 일부를 처리하며, 복합세포는 막대 형태의 움직임을 처리, 초복합세포는 각진 부분 즉 모서리의 움직임을 처리합니다.

각 시각피질의 세포들은 수직으로 세워놓은 기둥 형태로 조직되어 있는데 서로 다른 방향의 자극에 대해서 반응합니다.

시각피질에서 이러한 기둥 조직에 의해 방향성 정보를 부호화하는 것은 시각적인 공간을 뉴런에서 재구성 할 때 매우 중요한 역할을 하는 것으로 추정되지만 아직 확실하게 밝혀지지는 않았습니다.

확실한 것은 세포 기둥은 세포들의 단순한 집합이 아니라 역동적인 기능단위라는 것입니다.

 

시각피질을 구성하는 단순세포와 복합세포(초복합세포 포함) 중 단순세포는 정확한 입력패턴에 반응하며 엄격한 위치 선택성을 가집니다.

이에 반해 복합세포는 입력패턴을 조금 벗어나도 반응하죠.

이런 단순세포와 복합세포의 반응성을 모형화 해 보면 다음과 같습니다.

 

시각피질에서의 단순세포와 복합세포 역할 모형화 [ 이미지 참고 출처: 딥 러닝 제대로 시작하기(오카타니 타카유키 저/심효섭 역, 제이펍) 6장 ]

 

그림에서 보시는 것처럼 망막과 1차 시각피질에서 시각정보가 처리되는 과정을 모델링 한 것이 AI에서 사용하는 CNN 모델의 시작이라고 볼 수 있습니다.

AI, 특히 딥러닝 기반의 영상인식 모델 중에서 가장 기본이 되고 있는 CNN 모델에 관심이 있으신 분들은 "AI/Deep Learning 기초" 카테고리의 "CNN 모델의 기초" 편을 읽어보시기 바랍니다. ( https://aidalab.tistory.com/22 )

이 글과 연계하여 설명하고 있으므로 뇌, 즉 시각피질에서의 시각정보 처리과정이 어떻게 CNN으로 이어지는지 살펴보실 수 있습니다.

 

전체적인 시각정보의 흐름을 그려보면 아래의 그림과 같습니다.

 

시각정보의 흐름

 

더 상세한 내용을 알고 싶으신 분은 박문호 박사님께서 쓰신 "뇌, 생각의 출현 (박문호 지음, 휴머니스트 출판)" 에서 "3부. 뇌와 감각, 생각이 인간을 움직이다 - 13강. 보다, 시각과 뇌" 부분을 읽어보시기를 권해드립니다.

그 외에도 다양한 서적과 자료들이 있지만 이 책이 쉽게 읽히더군요.

 

지금까지 우리의 눈과 뇌에서 일어나는 시각정보 처리과정에 대하여 간략하게 살펴보았습니다.

 

 

 

반응형