[LLM] Reasoning Model

[์›๋ณธ ๋งํฌ]

Reasoning Model์€ LLM์˜ ๋ฐฉํ–ฅ์„ฑ์„ ํฌ๊ฒŒ ๋’คํŠผ ๊ฐœ์„  ๋ฐฉ์•ˆ ์ค‘ ํ•˜๋‚˜๋‹ค.
๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ์„œ ์ œ์‹œ๋˜์—ˆ๊ณ , ChatGPT๊ฐ€ GPT o1๋ฅผ 2024๋…„์— ์ถœ์‹œํ•˜๋ฉด์„œ ์ฒ˜์Œ ์‹œ๋„๋˜์—ˆ๋‹ค.

์ด ๋•Œ๋ฅผ ๊ธฐ์ ์œผ๋กœ LLM์˜ ์‹ค์„ฑ๋Šฅ ๊ณ ์ ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ๋‹ค.
๊ทธ๋ฆฌ๊ณ  ์ด๊ฒƒ๋„ ๋ชจ๋ธ ์ œ๊ณต์‚ฌ๋‚˜ ์ƒํ™ฉ๋งˆ๋‹ค ์šฉ์–ด๊ฐ€ ์ค‘๊ตฌ๋‚œ๋ฐฉ์ธ๋ฐ, ๋ณดํ†ต์€ Thinking์ด๋ผ๊ณ  ๋ถ€๋ฅด๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋” ๋งŽ๋‹ค.




๊ธฐ์กด์˜ LLM

Reasoning Model์ด ์ œ์‹œ๋˜๊ธฐ ์ „์˜ LLM๋“ค์€ ๋‹จ์ˆœํ•˜๊ณ  ์ง๊ด€์ ์ธ ํ˜•ํƒœ๋ฅผ ๊ฑฐ์ณค๋‹ค.
์ž…๋ ฅ์ด ๋“ค์–ด์˜ค๋ฉด, ๊ทธ๊ฑธ Transformer์— ๊ฑฐ์ณ์„œ ๋ฐ”๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•œ ๊ฒƒ์ด๋‹ค.

๋ฌผ๋ก  LLM ํŠน์œ ์˜ ๊ตฌ์กฐ ๋•Œ๋ฌธ์— ๋‚ด๋ถ€์ ์œผ๋กœ Token๊ณผ Attention ๋‹จ์œ„์˜ ๋ณ‘๋ ฌ ์ถ”๋ก ๊ณผ ์˜ˆ์ธก์„ ์ด๋ž˜์ €๋ž˜ ๋Œ๋ฆฌ๊ธด ํ•˜์ง€๋งŒ, ๊ฑฐ๊ธฐ์„œ ๋” ๋‚˜์•„๊ฐ€์ง€๋Š” ์•Š์•˜๋˜ ๊ฒƒ์ด๋‹ค.

์ด ๋ฐฉ์‹์€ ์†๋„๊ฐ€ ๋น ๋ฅด๊ณ  ๋น„์šฉํšจ์œจ์ ์ด๊ธด ํ•˜์ง€๋งŒ, ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š”๋ฐ๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ๋‹ค. ์ด๋ฅผํ…Œ๋ฉด ๋งค์šฐ ์–ด๋ ค์šด ์ˆ˜ํ•™ ๋ฌธ์ œ๋‚˜ ๋ณต์žกํ•œ ๋…ผ๋ฆฌ๊ฐ€ ํฌํ•จ๋œ ๋ฌธ์ œ, ๋Œ€ํ˜• ๋ฌธ์„œ ์ฒ˜๋ฆฌ ๊ฐ™์€ ๋ฌธ์ œ๋“ค ๋ง์ด๋‹ค.




Reasoning Model

Reasoning Model์€ ์œ„ ํ•œ๊ณ„๋ฅผ ๊ฐ„์ ‘์ ์œผ๋กœ ํ•ด์†Œํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
๋ง‰ ์—„์ฒญ๋‚˜๊ฒŒ ํ˜์‹ ์ ์ธ ๋ฐฉ๋ฒ•์„ ๋„์ž…ํ•˜๊ฑฐ๋‚˜ ํ•œ ๊ฒƒ์€ ์•„๋‹ˆ๊ณ , ์ž…๋ ฅ์ด ๋“ค์–ด์™”์„ ๋•Œ ๋ฐ”๋กœ ๋‹ต์„ ์ƒ์„ฑํ•˜๋Š” ๋Œ€์‹  ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ์ƒ๊ฐ(Thinking) ๊ณผ์ •์„ ๋จผ์ € ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•™์Šต๋œ ๋ชจ๋ธ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms

๋ณต์žกํ•œ ๋ฌธ์ œ๊ฐ€ ์ฃผ์–ด์ง€๋ฉด ๋ชจ๋ธ์€ ๋‚ด๋ถ€์ ์œผ๋กœ ๋ฌธ์ œ๋ฅผ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋กœ ๋‚˜๋ˆ„์–ด ํ•ด๊ฒฐ ์ „๋žต์„ ์„ธ์šฐ๊ณ , ๊ฐ ๋‹จ๊ณ„์˜ ๊ฒฐ๊ณผ๋ฅผ ๊ฒ€ํ† ํ•˜๊ฑฐ๋‚˜ ํ•„์š”ํ•˜๋ฉด ์ด์ „ ๋‹จ๊ณ„๋ฅผ ์ˆ˜์ •ํ•˜๋ฉด์„œ ์ถ”๋ก ์„ ์ด์–ด๊ฐ„๋‹ค. ์ด๋Ÿฌํ•œ ๊ณผ์ •์„ ๊ฑฐ์ณ ์ถฉ๋ถ„ํ•œ ๋‹ต์„ ์–ป์—ˆ๋‹ค๊ณ  ํŒ๋‹จ๋˜๋ฉด, ์ตœ์ข…์ ์œผ๋กœ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ข…ํ•ฉํ•˜์—ฌ ์‚ฌ์šฉ์ž์—๊ฒŒ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•œ๋‹ค.

๋‹ค๋งŒ ์ด๊ฒŒ ๋Œ€๋ถ€๋ถ„์˜ Reasoning Model ๊ตฌํ˜„์ฒด๋“ค์€ ๋‚ด๋ถ€ ๊ตฌํ˜„์„ ๊ณต๊ฐœํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ์ƒ์„ธํ•œ ๊ฒƒ์„ ์•Œ ์ˆ˜๋Š” ์—†๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ตœ๊ทผ ์˜คํ”ˆ๋ชจ๋ธ๋“ค์€ ํ•˜๋‚˜์˜ Base ๋ชจ๋ธ์„ ํ•™์Šตํ•œ ๋’ค, ์šฉ๋„์— ๋งž๊ฒŒ ์—ฌ๋Ÿฌ ํŒŒ์ƒ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค.
์ผ๋ฐ˜์ ์ธ Chat ๋ชจ๋ธ๊ณผ Coding ๋ชจ๋ธ, Reasoning ๋ชจ๋ธ ๋“ฑ์ด ๋ชจ๋‘ ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์œผ๋กœ ๋งŒ๋“ค์–ด์ง„๋‹ค.




Reasoning Model์˜ ํ•œ๊ณ„

๋‹น์—ฐํ•˜์ง€๋งŒ ์ด๊ฒŒ ๋ชจ๋“  ์ƒํ™ฉ์— ์ ํ•ฉํ•œ ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค.
์ˆ˜ํ•™์ด๋‚˜ ๊ฐœ๋ฐœ, ๋””๋ฒ„๊น… ๋“ฑ์—๋Š” ๊ณ ์ฐจ์›์ ์ธ ์‚ฌ๊ณ  ๋Šฅ๋ ฅ์ด ํ•„์š”ํ•ด์„œ ๋А๋ฆฌ๊ณ  ๋น„์‹ธ๋”๋ผ๋„ Reasoning์„ ๊ฑฐ์น˜๋Š” ๊ฒƒ์ด ์ข‹์ง€๋งŒ, ๊ทธ ์™ธ์—๋Š” ์• ๋งคํ•œ ๊ฒฝ์šฐ๋„ ์žˆ๋‹ค.

์ด๋ฅผํ…Œ๋ฉด ์ผ๋ฐ˜์ ์ธ ๋Œ€ํ™”๋‚˜ ์š”์•ฝ, ๋ฒˆ์—ญ ๊ฐ™์€ ๊ฒฝ์šฐ์—๋Š” Reasoning๊นŒ์ง€ ํ•„์š”ํ•˜์ง€๋Š” ์•Š๋‹ค.
์ด๋Ÿฐ ๊ฒฝ์šฐ์—๋Š” Reasoing ์˜ต์…˜์„ ๊ฐ•์ œ๋กœ ๋ˆ ์ฑ„๋กœ ์“ฐ๊ฑฐ๋‚˜ ํ•˜๋Š” ๊ฒƒ์ด ํ›จ์”ฌ ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ๋‚ผ ์ˆ˜๋„ ์žˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด๊ฒŒ ์ถ”๋ก  ์ž์ฒด์˜ ์„ฑ๋Šฅ์„ ๋†’์ธ๊ฒŒ ์•„๋‹ˆ๋ผ, ๋ถ„ํ•  ์ •๋ณต๊ณผ ๋ฆฌ๋ทฐ & ๊ฐœ์„ ์„ ํ†ตํ•ด์„œ ํ™˜๊ฐ์ด๋‚˜ ์‹ค์ˆ˜๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์ด๋ผ๋Š” ๋ฐ์„œ ์˜ค๋Š” ํ•œ๊ณ„๋„ ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ๋ฌด์ž‘์ • Reasoning์„ ์˜ค๋ž˜ ํ•œ๋‹ค๊ณ  ํ•ด์„œ ๊ฒฐ๊ณผ๊ฐ€ ์ข‹๊ฒŒ ๋‚˜์˜จ๋‹ค๋Š” ๋ณด์žฅ์€ ์—†๋‹ค. ์˜คํžˆ๋ ค ๋” ๋’คํ‹€๋ฆด ์ˆ˜๋„ ์žˆ๋‹ค.

์ด๋Ÿฐ ์ด์œ ๋“ค์—์„œ ํ˜„์žฌ ์ฃผ์š” ๋ชจ๋ธ๋“ค์€ Hybrid Thinking์ด๋ผ๋Š” ๋ฐฉ์‹์„ ์“ด๋‹ค. ๊ทธ๋ ‡๊ฒŒ ํŠน๋ณ„ํ•œ ๊ฒƒ์€ ์•„๋‹ˆ๊ณ , ๋‹จ์ˆœํ•œ ๋ฌธ์ œ๊ฐ€ ๋‚˜์˜ค๋ฉด Reasoning์„ ํ•˜์ง€ ์•Š๊ณ , ๋ณต์žกํ•œ ๋ฌธ์ œ๊ฐ€ ๋‚˜์˜ค๋ฉด Reasoning์„ ํ•˜๋„๋ก ๋‚ด๋ถ€ ๋ถ„๊ธฐ์ฒ˜๋ฆฌ๋ฅผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.




Reasoning Model์˜ ํ˜„ํ™ฉ

ํ˜„์žฌ ์ฃผ์š” AI ๋Œ€๊ธฐ์—…๋“ค์€ ์ „๋ถ€ Reasoning Model์„ ์ง€์›ํ•œ๋‹ค.
๋‹ค๋งŒ ์ด๊ฒŒ ๋น„์‹ธ๊ณ  ๋А๋ฆฌ๊ธฐ ๋•Œ๋ฌธ์— ๋ชจ๋“  ๋ชจ๋ธ์ด Reasoning์„ ์ง€์›ํ•˜์ง€๋Š” ์•Š์„ ์ˆ˜ ์žˆ๋‹ค.

์ด๋ฅผํ…Œ๋ฉด OpenAI์˜ ๊ฒฝ์šฐ์—๋Š” GPT o ์‹œ๋ฆฌ์ฆˆ (o1, o3, o4 ๋“ฑ)์— ํ•œํ•ด์„œ Reasoning์„ ์ œ๊ณตํ•œ๋‹ค.
Anthropic์˜ ๊ฒฝ์šฐ์—๋Š” Claude Opus & Sonnet ๊ณ„์—ด ๋ชจ๋ธ์ด Reasoning์„ ์ง€์›ํ•œ๋‹ค.
Google์˜ ๊ฒฝ์šฐ์—๋Š” 2.5 ๋ฒ„์ „๋ถ€ํ„ฐ ๊ฑฐ์˜ ๋ชจ๋“  GEMINI ์ฃผ์š” ๋ชจ๋ธ์ด Reasoning์„ ์ง€์›ํ•œ๋‹ค.

๊ณตํ†ต์ ์œผ๋กœ, Reasoning์„ ์–ผ๋งˆ๋‚˜ ํ• ์ง€ ์„ค์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์˜ต์…˜์„ ์ œ๊ณตํ•œ๋‹ค. Reasoning์„ ๊ธธ๊ฒŒ ํ• ์ˆ˜๋ก ๊ณ ํ’ˆ์งˆ์˜ ๊ฒฐ๊ณผ๋ฅผ ๋ฝ‘์•„๋‚ผ ์ˆ˜๋„ ์žˆ์ง€๋งŒ, ๊ทธ๋งŒํผ ๋А๋ ค์ง€๊ณ  ๋น„์šฉ๋„ ํฌ๊ฒŒ ๋ถ€๊ณผ๋˜๋Š” ๊ตฌ์กฐ์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.
์ด๊ฒƒ๋„ ์˜ต์…˜๋ช…์ด ์ œ๊ฐ๊ฐ์ด๋‹ค. thinking_level(GEMINI 3~), thinking_budget(GEMINI 2.5~), reasoning_effort(OpenAI), budget_tokens(Claude). OpenAI์˜ ๊ฒฝ์šฐ์—๋Š” ์ถ”์ƒํ™”๋œ ๋ ˆ๋ฒจ๋กœ๋งŒ ์ œํ•œ์„ ๊ฑธ ์ˆ˜ ์žˆ๊ณ , ๋‚˜๋จธ์ง€ ์ฃผ์š” ๋ชจ๋ธ์€ ํ† ํฐ ๋‹จ์œ„๋กœ ์˜ˆ์‚ฐ์„ ์ œ์•ฝํ•  ์ˆ˜ ์žˆ๋‹ค.

์˜คํ”ˆ ๋ชจ๋ธ๋“ค๋„ ์ผ๋ถ€ ๊ณ ์„ฑ๋Šฅ ๋ชจ๋ธ์€ Reasoning์„ ์ง€์›ํ•œ๋‹ค.
๋Œ€ํ‘œ์ ์ธ ์˜ˆ๋Š” ์ค‘๊ตญ์‚ฐ ๋ช…ํ’ˆ ๋ชจ๋ธ๋กœ ์•Œ๋ ค์ง„ Qwen์ด๋‹ค. Qwen3 Thinking ๋ชจ๋ธ์ด ๋”ฐ๋กœ ์žˆ๋‹ค.




Reasoning Model์˜ ๋ฏธ๋ž˜?

๋ชจ๋ฅด๊ฒ ๋‹ค.
์„ฑ๋Šฅ์˜ ๋ฒฝ์„ Reasoning์œผ๋กœ ์ƒ๋‹น์ˆ˜ ์šฐํšŒํ•œ ์ƒํ™ฉ์ด๊ธด ํ•œ๋ฐ, Reasoning์„ ํ†ตํ•ด ๊ทธ๋Ÿด๋“ฏํ•œ ํ–ฅ์ƒ์„ ๋” ๋‚ด๋Š”๊ฒŒ ์–ธ์ œ๊นŒ์ง€ ์ง€์†๋ ์ง€ ๋ชจ๋ฅด๊ฒ ๋‹ค.

์„ฑ์žฅํญ์ด ์ข€ ์™„๋งŒํ•ด์กŒ๋‹ค๊ฐ€ ๊ทผ๋ž˜์— ์ข€ ๋” ์น˜๊ณ  ์˜ฌ๋ผ์˜ค๋Š” ๊ฒƒ ๊ฐ™๊ธฐ๋Š” ํ•˜๋‹ค๋งŒ... ๋” ๋ด์•ผ ์•Œ ๊ฒƒ ๊ฐ™๋‹ค.
์ผ๋‹จ ์•„์ง์€ ์„ฑ์žฅ ์—ฌ๋ ฅ์ด ๋‚จ์•„ ์žˆ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ธ๋‹ค.



์ฐธ์กฐ
https://en.wikipedia.org/wiki/Reasoning_model
https://www.ibm.com/kr-ko/think/topics/reasoning-model
https://turingpost.co.kr/p/topic-44-reasoning-models
https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms