[LLM] Reasoning Model
Reasoning Model์ LLM์ ๋ฐฉํฅ์ฑ์ ํฌ๊ฒ ๋คํผ ๊ฐ์ ๋ฐฉ์ ์ค ํ๋๋ค.
๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ๋ฒ๋ก ์ผ๋ก์ ์ ์๋์๊ณ , ChatGPT๊ฐ GPT o1๋ฅผ 2024๋
์ ์ถ์ํ๋ฉด์ ์ฒ์ ์๋๋์๋ค.
์ด ๋๋ฅผ ๊ธฐ์ ์ผ๋ก LLM์ ์ค์ฑ๋ฅ ๊ณ ์ ์ด ํฌ๊ฒ ํฅ์๋์๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๊ฒ๋ ๋ชจ๋ธ ์ ๊ณต์ฌ๋ ์ํฉ๋ง๋ค ์ฉ์ด๊ฐ ์ค๊ตฌ๋๋ฐฉ์ธ๋ฐ, ๋ณดํต์ Thinking์ด๋ผ๊ณ ๋ถ๋ฅด๋ ๊ฒฝ์ฐ๊ฐ ๋ ๋ง๋ค.
๊ธฐ์กด์ LLM
Reasoning Model์ด ์ ์๋๊ธฐ ์ ์ LLM๋ค์ ๋จ์ํ๊ณ ์ง๊ด์ ์ธ ํํ๋ฅผ ๊ฑฐ์ณค๋ค.
์
๋ ฅ์ด ๋ค์ด์ค๋ฉด, ๊ทธ๊ฑธ Transformer์ ๊ฑฐ์ณ์ ๋ฐ๋ก ๋ต๋ณ์ ์์ฑํ ๊ฒ์ด๋ค.
๋ฌผ๋ก LLM ํน์ ์ ๊ตฌ์กฐ ๋๋ฌธ์ ๋ด๋ถ์ ์ผ๋ก Token๊ณผ Attention ๋จ์์ ๋ณ๋ ฌ ์ถ๋ก ๊ณผ ์์ธก์ ์ด๋์ ๋ ๋๋ฆฌ๊ธด ํ์ง๋ง, ๊ฑฐ๊ธฐ์ ๋ ๋์๊ฐ์ง๋ ์์๋ ๊ฒ์ด๋ค.
์ด ๋ฐฉ์์ ์๋๊ฐ ๋น ๋ฅด๊ณ ๋น์ฉํจ์จ์ ์ด๊ธด ํ์ง๋ง, ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋๋ฐ๋ ํ๊ณ๊ฐ ์์๋ค. ์ด๋ฅผํ ๋ฉด ๋งค์ฐ ์ด๋ ค์ด ์ํ ๋ฌธ์ ๋ ๋ณต์กํ ๋ ผ๋ฆฌ๊ฐ ํฌํจ๋ ๋ฌธ์ , ๋ํ ๋ฌธ์ ์ฒ๋ฆฌ ๊ฐ์ ๋ฌธ์ ๋ค ๋ง์ด๋ค.
Reasoning Model
Reasoning Model์ ์ ํ๊ณ๋ฅผ ๊ฐ์ ์ ์ผ๋ก ํด์ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
๋ง ์์ฒญ๋๊ฒ ํ์ ์ ์ธ ๋ฐฉ๋ฒ์ ๋์
ํ๊ฑฐ๋ ํ ๊ฒ์ ์๋๊ณ , ์
๋ ฅ์ด ๋ค์ด์์ ๋ ๋ฐ๋ก ๋ต์ ์์ฑํ๋ ๋์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๊ฐ(Thinking) ๊ณผ์ ์ ๋จผ์ ์ํํ๋๋ก ํ์ต๋ ๋ชจ๋ธ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms
๋ณต์กํ ๋ฌธ์ ๊ฐ ์ฃผ์ด์ง๋ฉด ๋ชจ๋ธ์ ๋ด๋ถ์ ์ผ๋ก ๋ฌธ์ ๋ฅผ ์ฌ๋ฌ ๋จ๊ณ๋ก ๋๋์ด ํด๊ฒฐ ์ ๋ต์ ์ธ์ฐ๊ณ , ๊ฐ ๋จ๊ณ์ ๊ฒฐ๊ณผ๋ฅผ ๊ฒํ ํ๊ฑฐ๋ ํ์ํ๋ฉด ์ด์ ๋จ๊ณ๋ฅผ ์์ ํ๋ฉด์ ์ถ๋ก ์ ์ด์ด๊ฐ๋ค. ์ด๋ฌํ ๊ณผ์ ์ ๊ฑฐ์ณ ์ถฉ๋ถํ ๋ต์ ์ป์๋ค๊ณ ํ๋จ๋๋ฉด, ์ต์ข
์ ์ผ๋ก ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ข
ํฉํ์ฌ ์ฌ์ฉ์์๊ฒ ๋ต๋ณ์ ์์ฑํ๋ค.
๋ค๋ง ์ด๊ฒ ๋๋ถ๋ถ์ Reasoning Model ๊ตฌํ์ฒด๋ค์ ๋ด๋ถ ๊ตฌํ์ ๊ณต๊ฐํ์ง ์๊ธฐ ๋๋ฌธ์ ์์ธํ ๊ฒ์ ์ ์๋ ์๋ค.
๊ทธ๋ฆฌ๊ณ ์ต๊ทผ ์คํ๋ชจ๋ธ๋ค์ ํ๋์ Base ๋ชจ๋ธ์ ํ์ตํ ๋ค, ์ฉ๋์ ๋ง๊ฒ ์ฌ๋ฌ ํ์ ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
์ผ๋ฐ์ ์ธ Chat ๋ชจ๋ธ๊ณผ Coding ๋ชจ๋ธ, Reasoning ๋ชจ๋ธ ๋ฑ์ด ๋ชจ๋ ์ด๋ฌํ ๋ฐฉ์์ผ๋ก ๋ง๋ค์ด์ง๋ค.
Reasoning Model์ ํ๊ณ
๋น์ฐํ์ง๋ง ์ด๊ฒ ๋ชจ๋ ์ํฉ์ ์ ํฉํ ๊ฒ์ ์๋๋ค.
์ํ์ด๋ ๊ฐ๋ฐ, ๋๋ฒ๊น
๋ฑ์๋ ๊ณ ์ฐจ์์ ์ธ ์ฌ๊ณ ๋ฅ๋ ฅ์ด ํ์ํด์ ๋๋ฆฌ๊ณ ๋น์ธ๋๋ผ๋ Reasoning์ ๊ฑฐ์น๋ ๊ฒ์ด ์ข์ง๋ง, ๊ทธ ์ธ์๋ ์ ๋งคํ ๊ฒฝ์ฐ๋ ์๋ค.
์ด๋ฅผํ
๋ฉด ์ผ๋ฐ์ ์ธ ๋ํ๋ ์์ฝ, ๋ฒ์ญ ๊ฐ์ ๊ฒฝ์ฐ์๋ Reasoning๊น์ง ํ์ํ์ง๋ ์๋ค.
์ด๋ฐ ๊ฒฝ์ฐ์๋ Reasoing ์ต์
์ ๊ฐ์ ๋ก ๋ ์ฑ๋ก ์ฐ๊ฑฐ๋ ํ๋ ๊ฒ์ด ํจ์ฌ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ผ ์๋ ์๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๊ฒ ์ถ๋ก ์์ฒด์ ์ฑ๋ฅ์ ๋์ธ๊ฒ ์๋๋ผ, ๋ถํ ์ ๋ณต๊ณผ ๋ฆฌ๋ทฐ & ๊ฐ์ ์ ํตํด์ ํ๊ฐ์ด๋ ์ค์๋ฅผ ์ค์ด๋ ๊ฒ์ด๋ผ๋ ๋ฐ์ ์ค๋ ํ๊ณ๋ ์๋ค. ๊ทธ๋์ ๋ฌด์์ Reasoning์ ์ค๋ ํ๋ค๊ณ ํด์ ๊ฒฐ๊ณผ๊ฐ ์ข๊ฒ ๋์จ๋ค๋ ๋ณด์ฅ์ ์๋ค. ์คํ๋ ค ๋ ๋คํ๋ฆด ์๋ ์๋ค.
์ด๋ฐ ์ด์ ๋ค์์ ํ์ฌ ์ฃผ์ ๋ชจ๋ธ๋ค์ Hybrid Thinking์ด๋ผ๋ ๋ฐฉ์์ ์ด๋ค. ๊ทธ๋ ๊ฒ ํน๋ณํ ๊ฒ์ ์๋๊ณ , ๋จ์ํ ๋ฌธ์ ๊ฐ ๋์ค๋ฉด Reasoning์ ํ์ง ์๊ณ , ๋ณต์กํ ๋ฌธ์ ๊ฐ ๋์ค๋ฉด Reasoning์ ํ๋๋ก ๋ด๋ถ ๋ถ๊ธฐ์ฒ๋ฆฌ๋ฅผ ํ๋ค๋ ๊ฒ์ด๋ค.
Reasoning Model์ ํํฉ
ํ์ฌ ์ฃผ์ AI ๋๊ธฐ์
๋ค์ ์ ๋ถ Reasoning Model์ ์ง์ํ๋ค.
๋ค๋ง ์ด๊ฒ ๋น์ธ๊ณ ๋๋ฆฌ๊ธฐ ๋๋ฌธ์ ๋ชจ๋ ๋ชจ๋ธ์ด Reasoning์ ์ง์ํ์ง๋ ์์ ์ ์๋ค.
์ด๋ฅผํ
๋ฉด OpenAI์ ๊ฒฝ์ฐ์๋ GPT o ์๋ฆฌ์ฆ (o1, o3, o4 ๋ฑ)์ ํํด์ Reasoning์ ์ ๊ณตํ๋ค.
Anthropic์ ๊ฒฝ์ฐ์๋ Claude Opus & Sonnet ๊ณ์ด ๋ชจ๋ธ์ด Reasoning์ ์ง์ํ๋ค.
Google์ ๊ฒฝ์ฐ์๋ 2.5 ๋ฒ์ ๋ถํฐ ๊ฑฐ์ ๋ชจ๋ GEMINI ์ฃผ์ ๋ชจ๋ธ์ด Reasoning์ ์ง์ํ๋ค.
๊ณตํต์ ์ผ๋ก, Reasoning์ ์ผ๋ง๋ ํ ์ง ์ค์ ํ ์ ์๋ ์ต์
์ ์ ๊ณตํ๋ค. Reasoning์ ๊ธธ๊ฒ ํ ์๋ก ๊ณ ํ์ง์ ๊ฒฐ๊ณผ๋ฅผ ๋ฝ์๋ผ ์๋ ์์ง๋ง, ๊ทธ๋งํผ ๋๋ ค์ง๊ณ ๋น์ฉ๋ ํฌ๊ฒ ๋ถ๊ณผ๋๋ ๊ตฌ์กฐ์ด๊ธฐ ๋๋ฌธ์ด๋ค.
์ด๊ฒ๋ ์ต์
๋ช
์ด ์ ๊ฐ๊ฐ์ด๋ค. thinking_level(GEMINI 3~), thinking_budget(GEMINI 2.5~), reasoning_effort(OpenAI), budget_tokens(Claude). OpenAI์ ๊ฒฝ์ฐ์๋ ์ถ์ํ๋ ๋ ๋ฒจ๋ก๋ง ์ ํ์ ๊ฑธ ์ ์๊ณ , ๋๋จธ์ง ์ฃผ์ ๋ชจ๋ธ์ ํ ํฐ ๋จ์๋ก ์์ฐ์ ์ ์ฝํ ์ ์๋ค.
์คํ ๋ชจ๋ธ๋ค๋ ์ผ๋ถ ๊ณ ์ฑ๋ฅ ๋ชจ๋ธ์ Reasoning์ ์ง์ํ๋ค.
๋ํ์ ์ธ ์๋ ์ค๊ตญ์ฐ ๋ช
ํ ๋ชจ๋ธ๋ก ์๋ ค์ง Qwen์ด๋ค. Qwen3 Thinking ๋ชจ๋ธ์ด ๋ฐ๋ก ์๋ค.
Reasoning Model์ ๋ฏธ๋?
๋ชจ๋ฅด๊ฒ ๋ค.
์ฑ๋ฅ์ ๋ฒฝ์ Reasoning์ผ๋ก ์๋น์ ์ฐํํ ์ํฉ์ด๊ธด ํ๋ฐ, Reasoning์ ํตํด ๊ทธ๋ด๋ฏํ ํฅ์์ ๋ ๋ด๋๊ฒ ์ธ์ ๊น์ง ์ง์๋ ์ง ๋ชจ๋ฅด๊ฒ ๋ค.
์ฑ์ฅํญ์ด ์ข ์๋งํด์ก๋ค๊ฐ ๊ทผ๋์ ์ข ๋ ์น๊ณ ์ฌ๋ผ์ค๋ ๊ฒ ๊ฐ๊ธฐ๋ ํ๋ค๋ง... ๋ ๋ด์ผ ์ ๊ฒ ๊ฐ๋ค.
์ผ๋จ ์์ง์ ์ฑ์ฅ ์ฌ๋ ฅ์ด ๋จ์ ์๋ ๊ฒ์ฒ๋ผ ๋ณด์ธ๋ค.
์ฐธ์กฐ
https://en.wikipedia.org/wiki/Reasoning_model
https://www.ibm.com/kr-ko/think/topics/reasoning-model
https://turingpost.co.kr/p/topic-44-reasoning-models
https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms