[Pytorch] 모델 만들어보기

#Pytorch

모델을 간단하게나마 말아보면서 그 구조를 파악해보겠다.

모델 클래스 정의

대부분의 모델은 nn.Module을 상속하는 클래스를 정의하는 것으로 시작한다.
nn.Module는 신경망(Neural Network)에 대한 기본 기능 구조를 제공하는 클래스다.

한번 하나 정의해보자

import torch.nn as nn

class SimpleModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(2, 3)

    def forward(self, x):
        return self.linear(x)

model = SimpleModel()

print(model)

자. 여기서 nn.Linear(4, 8) 이 부분이 레이어를 정의하는 부분이다.
여기서 4가 입력에 대한 값이고, 8이 출력에 대한 값이다.
다시 말해 입력으로는 길이 4짜리 텐서(float array), 출력으로는 길이 8짜리 텐서를 반환하는 것이다. 여기서는 간결함을 위해 짧은 값을 정의했지만, 실제 사례에서는 훨씬 길 것이다.

forward는 실제로 모델에 입력이 들어올때 어떻게 동작할지를 정의한다.
이 경우에는 linear의 기본 동작을 타도록 포워딩했다.

아무튼 저대로 실행해보면

모델 정보가 나온다.

학습 돌려보기

입력/출력 쌍을 4개 정도만 정의해서 학습을 시켜보겠다.

x = torch.tensor([[1.0, 1.0], [2.0, 2.0], [3.0, 3.0], [4.0, 4.0]])
y = torch.tensor([[3.0, 5.0, 7.0], [5.0, 7.0, 9.0], [7.0, 9.0, 11.0], [9.0, 11.0, 13.0]])

x가 입력, y가 출력이다.
이 2차원 배열을 tensor라고 부르고, 안에 들어있는 작은 배열들을 row나 sample이라고 부른다.
위에서 정의한 입력과 출력에 대한 크기 정의는 이 row에 대한 것이었다.

그리고 입력 텐서의 길이와 출력 텐서의 길이는 같아야 한다.
x[0]와 y[0]이 각각 한 쌍의 입출력 쌍이 되는 것이기 때문이다.

그러면 저 입/출력 값을 집어넣고 돌려보자.

criterion = nn.MSELoss()  # 평균제곱오차
optimizer = optim.SGD(model.parameters(), lr=0.01)  # 확률적 경사하강법

# 10번 반복해서 학습 (epoch)
for epoch in range(1000):
    optimizer.zero_grad()         # 기울기 초기화
    outputs = model(x)            # 모델에 입력값 전달
    loss = criterion(outputs, y)  # 손실 계산
    loss.backward()               # 역전파
    optimizer.step()              # 파라미터 업데이트

    if (epoch+1) % 100 == 0:
        print(f'Epoch [{epoch+1}/1000], Loss: {loss.item():.4f}')

# 결과 확인
print("학습된 가중치:", model.linear.weight.tolist())
print("학습된 편향:", model.linear.bias.tolist())