Ch.03

행렬과 데이터 묶음: 여러 벡터를 한 장에 담는 법

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 중급 수학 흐름을 한눈에 보세요.

m\times n

행렬(Matrix) 은 숫자를 가로와 세로로 가지런히 정리해 둔'마법의 엑셀 표' 와 같습니다. 머신러닝에서는 이 표의 가로 한 줄(행)을'한 사람의 데이터(샘플)' 로, 세로 한 줄(열)을'키, 몸무게 같은 특징(피처)' 으로 읽는 경우가 많습니다. 이번 장에서는 앞서 배운 한 줄짜리 벡터(Ch.01)와 내적(Ch.02)이 어떻게 여러 개로 묶여 한 장의 거대한 행렬이 되는지 알아보고, 딥러닝의 핵심인 행렬 곱과 선형층(Ch.04) 으로 자연스럽게 넘어갈 준비를 합니다.

m\times n

가장 쉬운 비유는 우리가 흔히 쓰는 엑셀 스프레드시트 입니다. 표 안의 각 칸은 하나의 숫자를 담고 있습니다. 표를 세로(열) 로 쭉 읽어 내리면 "모든 사람의 키 데이터 묶음"이라는 하나의 특징 벡터가 되고, 표를 가로(행) 로 쭉 읽으면 "A라는 사람의 키, 몸무게, 나이 기록"이라는 한 사람의 샘플 벡터가 됩니다. 즉, 같은 표라도 어느 방향으로 읽느냐 에 따라 데이터의 의미가 완전히 달라집니다.

A

딥러닝 에서는 AI가 생각하는 뇌 구조(가중치)가 바로 이 행렬 로 이루어져 있습니다. 수만 장의 고양이와 강아지 사진을 학습할 때, 이 사진들을 하나하나 계산하지 않고 커다란 행렬로 묶어서 한 번에 곱해버립니다(배치 학습). 머신러닝에서 흔히 등장하는 설계행렬(Design Matrix) 역시, 수많은 데이터 특징들을 행이나 열로 겹겹이 쌓아 만든 튼튼한 데이터 묶음입니다.

한 줄 요약: 행렬은 여러 개의 벡터를 한 장에 예쁘게 묶어 놓은 거대한 표 입니다. 어느 방향(가로/세로) 으로 읽느냐에 따라 샘플이 되기도 하고 특징이 되기도 합니다. 표를 휙 뒤집는 전치(Transpose) 는 데이터의 짝(차원)을 맞출 때 사용하는 필수 도구이며, 이 개념들을 단단히 다져두면 다음 장의 행렬 곱과 선형 변환 을 아주 매끄럽게 소화할 수 있습니다.

A\mathbf{x}

\times

X\in\mathbb{R}^{m\times n}

선형대수/기하 관점 에서는 행렬이 "공간을 어떻게 바꾸는지"를 설명합니다. 회전, 스케일, 축 혼합, 투영이 모두 행렬로 표현됩니다. 텐서는 이런 변환을 여러 축에서 동시에 수행하는 확장판입니다. 예를 들어 배치가 64개인 입력 텐서에 같은 선형층을 적용한다는 말은, 사실상 같은 행렬 변환을 64번 병렬 적용 한다는 뜻입니다. 따라서 "텐서가 어렵다"고 느껴질 때 가장 효과적인 접근은 텐서를 행렬 블록으로 분해해 읽는 것입니다. 이 습관이 생기면 모델 구조를 해석하고 디버깅하는 속도가 크게 빨라집니다.

아래 표에는 문제 풀이에 필요한 기호와 차원 규칙 을 요약했습니다. 풀이 예시 는 대표 유형별로 단계를 적어 두었습니다.

m\times n

연습 문제

영행렬의 성질로 옳은 것은?

1 / 10

행렬과 데이터 묶음: 여러 벡터를 한 장에 담는 법

m\times n

가장 쉬운 비유는 우리가 흔히 쓰는 엑셀 스프레드시트 입니다. 표 안의 각 칸은 하나의 숫자를 담고 있습니다. 표를 세로(열) 로 쭉 읽어 내리면 "모든 사람의 키 데이터 묶음"이라는 하나의 특징 벡터가 되고, 표를 가로(행) 로 쭉 읽으면 "A라는 사람의 키, 몸무게, 나이 기록"이라는 한 사람의 샘플 벡터가 됩니다. 즉, 같은 표라도 어느 방향으로 읽느냐 에 따라 데이터의 의미가 완전히 달라집니다.

A

딥러닝 에서는 AI가 생각하는 뇌 구조(가중치)가 바로 이 행렬 로 이루어져 있습니다. 수만 장의 고양이와 강아지 사진을 학습할 때, 이 사진들을 하나하나 계산하지 않고 커다란 행렬로 묶어서 한 번에 곱해버립니다(배치 학습). 머신러닝에서 흔히 등장하는 설계행렬(Design Matrix) 역시, 수많은 데이터 특징들을 행이나 열로 겹겹이 쌓아 만든 튼튼한 데이터 묶음입니다.

한 줄 요약: 행렬은 여러 개의 벡터를 한 장에 예쁘게 묶어 놓은 거대한 표 입니다. 어느 방향(가로/세로) 으로 읽느냐에 따라 샘플이 되기도 하고 특징이 되기도 합니다. 표를 휙 뒤집는 전치(Transpose) 는 데이터의 짝(차원)을 맞출 때 사용하는 필수 도구이며, 이 개념들을 단단히 다져두면 다음 장의 행렬 곱과 선형 변환 을 아주 매끄럽게 소화할 수 있습니다.

A\mathbf{x}

\times

X\in\mathbb{R}^{m\times n}

선형대수/기하 관점 에서는 행렬이 "공간을 어떻게 바꾸는지"를 설명합니다. 회전, 스케일, 축 혼합, 투영이 모두 행렬로 표현됩니다. 텐서는 이런 변환을 여러 축에서 동시에 수행하는 확장판입니다. 예를 들어 배치가 64개인 입력 텐서에 같은 선형층을 적용한다는 말은, 사실상 같은 행렬 변환을 64번 병렬 적용 한다는 뜻입니다. 따라서 "텐서가 어렵다"고 느껴질 때 가장 효과적인 접근은 텐서를 행렬 블록으로 분해해 읽는 것입니다. 이 습관이 생기면 모델 구조를 해석하고 디버깅하는 속도가 크게 빨라집니다.

아래 표에는 문제 풀이에 필요한 기호와 차원 규칙 을 요약했습니다. 풀이 예시 는 대표 유형별로 단계를 적어 두었습니다.

m\times n

영행렬의 성질로 옳은 것은?

1 / 10