[AWS] Sagemaker AI: ๋ชจ๋ธ ์„œ๋น™

[์›๋ณธ ๋งํฌ]

Sagemaker๋Š” AWS์—์„œ ์ œ๊ณตํ•˜๋Š” AI ๋ชจ๋ธ ๊ฐœ๋ฐœ/์„œ๋น™์šฉ ํ”Œ๋žซํผ์ด๋‹ค.
๋‹จ์ผ ์„œ๋น„์Šค์ฒ˜๋Ÿผ ์†Œ๊ฐœํ•˜๊ธด ํ•˜๋Š”๋ฐ, ์˜จ๊ฐ– ๋‹ค์–‘ํ•œ ๋ณ„๋„ ๊ธฐ๋Šฅ๋“ค์ด ํ•˜๋‚˜๋กœ ๋ญ‰์ณ์ง„ ํ˜ผ์ข…์ด๋‹ค. ์•ˆ์“ฐ๋Š” ๊ธฐ๋Šฅ์ด ๋” ๋งŽ๋‹ค.

์—ฌ๊ธฐ์„œ๋Š” AI ๋ชจ๋ธ์„ ๋ฐฐํฌํ•˜๊ธฐ์— ์œ ์šฉํ•œ Realtime Endpoint(Realtime Inference)๋ฅผ ์œ„์ฃผ๋กœ ์†Œ๊ฐœํ•ด๋ณธ๋‹ค.




๊ตฌ์กฐ

๊ธฐ๋ณธ์ ์œผ๋กœ ECS์ฒ˜๋Ÿผ ์ปจํ…Œ์ด๋„ˆ ๊ธฐ๋ฐ˜์˜ ๋ฐฉ๋ฒ•๋ก ์„ ๋”ฐ๋ฅธ๋‹ค.
๋ชจ๋ธ ์„œ๋ฒ„๋ฅผ ์ปจํ…Œ์ด๋„ˆ๋กœ ๋ง์•„์„œ ECR์— ์˜ฌ๋ ค๋†“๊ณ  Sagemaker์— ๋ชจ๋ธ๋กœ์„œ ๋“ฑ๋ก์„ ํ•˜๋ฉด, ์„ค์ •ํ•˜๊ธฐ์— ๋”ฐ๋ผ์„œ Sagemaker๊ฐ€ ๋ชจ๋ธ์„œ๋ฒ„๋ฅผ ์ž๋™์œผ๋กœ ํ”„๋กœ๋น„์ €๋‹ํ•ด์„œ ์“ธ ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ๊ฒƒ์ด๋‹ค.

์ด๋Ÿฐ ์‹์ด๋‹ค.
์•„๋งˆ ๋‚ด๋ถ€ ์ธํ”„๋ผ๋Š” EC2๋ฅผ ์‚ฌ์šฉํ•  ๊ฒƒ์ด๋‹ค. ํฌ์žฅ๋งŒ ์ž˜ ํ•ด์„œ ํŒŒ๋Š” ๊ฒƒ์ด๋‹ค.




์ด์ 

๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ด์ ๋“ค์ด ์žˆ๋‹ค.

๋กœ๊ทธ ์ž๋™ ๊ด€๋ฆฌ (cloudwatch)
๋ฉ”ํŠธ๋ฆญ ์ž๋™ ๊ด€๋ฆฌ
๋ฌด์ค‘๋‹จ ๋ฐฐํฌ ๊ธฐ๋ณธ ์ง€์›
์—”๋“œํฌ์ธํŠธ ์ž๋™ ์ง€์›
๊ฐ„ํŽธํ•œ ์Šค์ผ€์ผ๋ง ๊ธฐ๋Šฅ
์ŠคํŒŒ์ดํฌ ๋Œ€์‘์„ ์œ„ํ•œ ๋น„๋™๊ธฐ ์ถ”๋ก  ๊ธฐ๋Šฅ
์ดˆ๋Œ€ํ˜• ์ถ”๋ก ์„ ์œ„ํ•œ Batch ๊ธฐ๋Šฅ ์ง€์›




์ œํ•œ์‚ฌํ•ญ ๋ฐ ํ•œ๊ณ„

์ปจํ…Œ์ด๋„ˆ๋กœ ๋ง๊ธฐ ๋•Œ๋ฌธ์— ๊ธฐ์ˆ  ์ž์œ ๋„๋Š” ์ œ๋ฒ• ์žˆ๋Š” ํŽธ์ด๊ธด ํ•œ๋ฐ, ๊ทธ๋ž˜๋„ ๋ช‡๊ฐ€์ง€ ํ”„๋กœํ† ์ฝœ/๋“œ๋ผ์ด๋ฒ„ ์ˆ˜์ค€ ์ œํ•œ์‚ฌํ•ญ์€ ์žˆ๋‹ค.

  1. ๋ชจ๋ธ ๊ตฌ์„ฑ์€ cuda 12.* ๋ฒ„์ „์— ํ˜ธํ™˜๋˜์–ด์•ผ ํ•œ๋‹ค.
  2. ์„œ๋ฒ„๋Š” 8080 ํฌํŠธ๋กœ ์—ด๋ ค์•ผ ํ•œ๋‹ค.
  3. ์ •ํ•ด์ง„ ํ˜•ํƒœ๋กœ API๋ฅผ ๊ฐœ๋ฐฉํ•ด์•ผ ํ•œ๋‹ค.
  4. (์„œ๋ฒ„๋ฆฌ์Šค์˜ ๊ฒฝ์šฐ) ๋ชจ๋ธ์ด ๋จน๋Š” ๋ฉ”๋ชจ๋ฆฌ์˜ HARD LIMIT์€ 6GB๋‹ค.
  5. (๋™๊ธฐํ˜• ํ”„๋กœ๋น„์ €๋‹์˜ ๊ฒฝ์šฐ) ๋ชจ๋ธ ์ธ์Šคํ„ด์Šค๋ฅผ 0๊ฐœ๋กœ ์ค„์ผ ์ˆ˜ ์—†๋‹ค.



๋น„์šฉ

๋‹น์—ฐํ•˜์ง€๋งŒ, ๋งˆ๋ƒฅ ์‹ธ์ง„ ์•Š๋‹ค.
https://aws.amazon.com/ko/sagemaker/ai/pricing/

๊ฐ€์žฅ ์ง๊ด€์ ์ธ ํ”„๋กœ๋น„์ €๋‹์˜ ๊ฒฝ์šฐ์—๋Š” EC2 ์ฒ˜๋Ÿผ ํƒ€์ž…๋ณ„ ์š”๊ธˆ์„ ๋œฏ๋Š”๋‹ค.

CPU๋งŒ ์žˆ๋Š”๊ฑด ์‹ธ๊ณ , GPU ๋‹ฌ๋ฆฐ๊ฑด ๋‹น์—ฐํžˆ ๋น„์‹ธ๋‹ค.
๋™์ผ์ŠคํŽ™์˜ EC2 ๋Œ€๋น„ ๋Œ€๋žต 1.5๋ฐฐ์ฏค ๋น„์‹ผ ํŽธ์ด๋‹ค.


์„œ๋ฒ„๋ฆฌ์Šค์˜ ๊ฒฝ์šฐ ์‹คํ–‰๋œ ์‹œ๊ฐ„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋œฏ๊ณ , ํŠธ๋ž˜ํ”ฝ์œผ๋กœ ๋œฏ๋Š”๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด ์šฉ๋„๋กœ AI Saving Plan์ด ๋”ฐ๋กœ ์žˆ๋‹ค. ์ด๊ฑด ํ”„๋กœ๋น„์ €๋‹์— ๋Œ€ํ•ด์„œ๋งŒ ์ง€์›๋˜๋ฉฐ, 1๋…„ ์„ ๊ฒฐ์ œ ๊ธฐ์ค€ 30% ์ •๋„๊ฐ€ ์ ˆ๊ฐ๋œ๋‹ค.
https://aws.amazon.com/ko/savingsplans/ml-pricing/




Docker ์ด๋ฏธ์ง€ ๋ง๊ธฐ

๋จผ์ € ์„œ๋ฒ„ ๊ทœ๊ฒฉ์— ๋งž์ถฐ์„œ ์ฝ”๋“œ๋ฅผ ์ข€ ์ถ”๊ฐ€ํ•ด์•ผ ํ•œ๋‹ค.
๋‹ค์Œ 2๊ฐ€์ง€ API๊ฐ€ ํ•„์ˆ˜์ ์ด๋‹ค.

ping์ด ํ—ฌ์Šค์ฒดํฌ์šฉ์ด๊ณ , invacation์ด ์ถ”๋ก  API๋‹ค.

์ด๋ฏธ์ง€๋ฅผ ๋ง๋•Œ๋„ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ๋„ฃ์ง€ ์•Š๋„๋ก ์•ฝ๊ฐ„ ์˜ต์…˜์„ ์ค˜์•ผ ํ•œ๋‹ค.
์•ˆ๊ทธ๋Ÿฌ๋ฉด ๋ชจ๋ธ ๋“ฑ๋กํ• ๋•Œ ๋ป‘๋‚œ๋‹ค. provenance์™€ sbom๋ฅผ ๊บผ์„œ ์˜ฌ๋ฆฌ์ž.

docker buildx build --platform linux/amd64 \
  --provenance=false \
  --sbom=false \
  -f Dockerfile.sagemaker-cpu \
  -t "$AWS_ACCOUNT_ID.dkr.ecr.$REGION.amazonaws.com/$REPO:$TAG" \
  --push .

๊ทธ๋ฆฌ๊ณ  ECR์— ์ž˜ ์˜ฌ๋ฆฌ๊ธฐ๋งŒ ํ•˜๋ฉด ๋œ๋‹ค.




๋ชจ๋ธ ์ƒ์„ฑ

์ด์ œ AWS๋กœ ๊ฐ€์„œ ๋ชจ๋ธ์„ ๋“ฑ๋กํ•ด๋ณด์ž.

Deployable Models ํƒญ์œผ๋กœ ์ด๋™ํ•œ๋‹ค.


๊ทธ๋ฆฌ๊ณ  ๋ฐฉ๊ธˆ ์˜ฌ๋ฆฐ ECR ๊ฒฝ๋กœ๋ฅผ ์ ๋‹นํžˆ ๋„ฃ์–ด์ฃผ๋ฉด ๋œ๋‹ค.


๋„คํŠธ์›Œํฌ ์˜ต์…˜์€ ์„ ํƒ์ด๋‹ค.
๋งŒ์•ฝ ํ—ˆ๊น…ํŽ˜์ด์Šค ๊ฐ™์€ ๋ฐ์„œ ๋‹ค์šด๋ฐ›๊ฑฐ๋‚˜ ์ด๋ฏธ์ง€๋ฅผ ๋‹ค์šด๋ฐ›๊ฑฐ๋‚˜ ํ•˜๋ฉด ์ € ๊ฒฉ๋ฆฌ๋ฅผ ๊บผ์•ผํ•œ๋‹ค.
๋ณด์•ˆ์ด ์ค‘์š”ํ•˜๋‹ค๋ฉด ์ผœ๋Š”๊ฒŒ ์ข‹๋‹ค.


๊ทธ๋ž˜์„œ ์ด๋ ‡๊ฒŒ ๋“ฑ๋ก์ด ๋˜๋ฉด ๋ฒฝ๋Œ ํ•˜๋‚˜๋Š” ์™„์„ฑํ•œ ๊ฒƒ์ด๋‹ค.




์—”๋“œํฌ์ธํŠธ Config ์ƒ์„ฑ

๊ทธ ๋‹ค์Œ์—๋Š” ๊ตฌ์„ฑ์„ ๋งŒ๋“ค์–ด์•ผ ํ•œ๋‹ค. ์–ด๋–ค ์ธ์Šคํ„ด์Šค ํƒ€์ž…์œผ๋กœ ๋„์šธ์ง€ ๋“ฑ์„ ์„ ํƒํ•œ๋‹ค.

์ด๊ฒŒ ์ข€ ํ—ท๊ฐˆ๋ฆฌ๋Š”๊ฒŒ ์žˆ๋Š”๋ฐ, ๋ณ€ํ˜•์— ๋ชจ๋ธ์„ ๊ณจ๋ผ์„œ ๋„ฃ์œผ๋ฉด ์ง€๋ง˜๋Œ€๋กœ ์ธ์Šคํ„ด์Šค ํƒ€์ž…์„ ๊ณ ์ •ํ•ด์„œ ๋„ฃ์–ด๋ฒ„๋ฆฐ๋‹ค.

์ €๊ธฐ ์˜ค๋ฅธํŽธ์— ์ˆจ์–ด์žˆ๋Š” ํŽธ์ง‘ ๋ฒ„ํŠผ์„ ๋ˆŒ๋Ÿฌ์•ผ ํƒ€์ž…์„ ๊ณ ๋ฅผ ์ˆ˜ ์žˆ๋‹ค.





ํ”„๋กœ๋น„์ €๋‹ ์—”๋“œํฌ์ธํŠธ ๋งŒ๋“ค๊ธฐ

๊ทธ๋Ÿผ ์ด์ œ ๋ฐฉ๊ธˆ ๋งŒ๋“  ๊ตฌ์„ฑ์„ ํ†ตํ•ด์„œ ์‹ค์ œ ์—”๋“œํฌ์ธํŠธ๋ฅผ ๋งŒ๋“ค๋ฉด ๋œ๋‹ค.
์ด๊ฒŒ ์ฐ๋ง‰์ด๋‹ค.

๊ณจ๋ผ์„œ ์ƒ์„ฑํ•˜๋ฉด, ์ƒ์„ฑ ์‹œ๊ฐ„์ด ์•ฝ๊ฐ„ ๊ฑธ๋ฆฐ๋‹ค.


๊ทธ๋Ÿฌ๋ฉด ์ €๊ธฐ URL์ด ์ƒ๊ธฐ๋Š”๋ฐ


๊ฐ€๋ผ๋กœ ๋งŒ๋“ ๊ฑฐ๋ผ์„œ ์ €๊ฑธ ์ง์ ‘ ์“ฐ์ง„ ๋ชปํ•œ๋‹ค. URL ์ž์ฒด๊ฐ€ ๋ณ„๋กœ ์œ ๋‹ˆํฌํ•ด๋ณด์ด์ง„ ์•Š์ž–๋‚˜.

๊ฐ€์žฅ ํŽธ๋ฆฌํ•œ ๋ฐฉ๋ฒ•์€ sdk๋‚˜ api๋ฅผ ์“ฐ๋Š” ๊ฒƒ์ด๋‹ค.

aws sagemaker-runtime invoke-endpoint \
  --region ap-northeast-2 \
  --endpoint-name ์—”๋“œํฌ์ธํŠธ๋ช… \
  --content-type application/json \
  --cli-binary-format raw-in-base64-out \
  --body '{"text":"The battery life is terrible","aspect":"battery"}' \
  output.json

์ด๋Ÿฐ ๋А๋‚Œ์œผ๋กœ ๋‚ ๋ฆฌ๋ฉด ์‘๋‹ต์ด ๊ตฌ์„ฑํ•œ๋Œ€๋กœ json์œผ๋กœ ์ž˜ ๋‚ ๋ผ์˜ฌ ๊ฒƒ์ด๋‹ค.




๊ด€์ธก์„ฑ

๊ด€๋ฆฌํ˜• ์„œ๋น„์Šค์ด๊ธฐ ๋•Œ๋ฌธ์—, ๊ธฐ๋ณธ์ ์ธ ๋ฉ”ํŠธ๋ฆญ์€ ์•Œ์•„์„œ ์Œ“๊ณ  ์ œ๊ณตํ•ด์ค€๋‹ค.
CPU/๋ฉ”๋ชจ๋ฆฌ ์ •๋ณด ๋“ฑ์€ ๊ธฐ๋ณธ ํŽ˜์ด์ง€์—์„œ ์ œ๊ณตํ•˜๋ฉฐ

๋กœ๊ทธ๋„ Cloudwatch๋ฅผ ํ†ตํ•ด ์ œ๊ณตํ•œ๋‹ค.




์˜คํ† ์Šค์ผ€์ผ๋ง

์„œ๋ฒ„๋ฅผ ์ค„์ด๊ณ  ๋Š˜๋ฆฌ๋Š” ๊ฒƒ๋„ ๊ฝค ๊ฐ„ํŽธํ•˜๋‹ค.

์—ฌ๊ธฐ์„œ ๊ทธ๋ƒฅ ๋ฐ”๊ฟ”๋„ ๋˜๊ณ 


์˜คํ† ์Šค์ผ€์ผ๋ง์„ ๊ตฌ์„ฑํ•ด์„œ ์Šค์ผ€์ผ๋ง์„ ์ž๋™ํ™”ํ•  ์ˆ˜๋„ ์žˆ๋‹ค.


๋‹ค๋งŒ. ๊ธฐ๋ณธ ์—”๋“œํฌ์ธํŠธ ๊ตฌ์„ฑ์—์„œ๋Š” 0๊ฐœ๋กœ ์ž๋™ ์ถ•์†Œ๋Š” ์ง€์›๋˜์ง€ ์•Š๋Š”๋‹ค. ์ด๊ฑด Async ์—”๋“œํฌ์ธํŠธ์—์„œ๋งŒ ๊ฐ€๋Šฅํ•˜๋‹ค.




Async ์—”๋“œํฌ์ธํŠธ

ASync ์—”๋“œํฌ์ธํŠธ๋Š” ์ŠคํŒŒ์ดํฌ ํŒจํ„ด์— ์ตœ์ ํ™”๋œ ํ•œ ๋ณ€ํ˜•์ด๋‹ค.
์—”๋“œํฌ์ธํŠธ ๊ตฌ์„ฑ ์ˆ˜์ค€์—์„œ ์„ค์ •ํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด๋ ‡๊ฒŒ ์ ๋‹นํžˆ ์„ค์ •ํ•˜๊ณ , ์—”๋“œํฌ์ธํŠธ๋ฅผ ์ƒˆ๋กœ ์ƒ์„ฑํ•œ๋‹ค.
์—”๋“œํฌ์ธํŠธ๋Š” ๊ตฌ์„ฑ์„ ๋‹ค์šดํƒ€์ž„ ์—†์ด ๊ต์ฒดํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, Async <> Sync ๊ต์ฒด๋Š” ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. ์ƒˆ๋กœ ๋งŒ๋“ค์–ด์•ผ ํ•œ๋‹ค.

Async ์ถ”๋ก ์€ ์‚ฌ์šฉ ๋ฐฉ๋ฒ•์ด ์ข€ ๋‹ค๋ฅด๋‹ค.

์š”์ฒญ json์„ ๋ฒ„ํ‚ท์— ์˜ฌ๋ฆฐ ๋‹ค์Œ์—

๊ทธ ๊ฒฝ๋กœ๋ฅผ ๋„ฃ์–ด์„œ ์ด์•ผ ํ•œ๋‹ค.

aws sagemaker-runtime invoke-endpoint-async \
  --region ap-northeast-2 \
  --endpoint-name ์—”๋“œํฌ์ธํŠธ\
  --content-type application/json \
  --input-location ํŒŒ์ผ๊ฒฝ๋กœ

๊ทธ๋Ÿผ ์ด๋ ‡๊ฒŒ ์‘๋‹ต์ด ์˜ค๋Š”๋ฐ, InferenceID๋Š” ์“ธ๋ชจ๊ฐ€ ์—†๋‹ค. ์™„๋ฃŒ ์•Œ๋ฆผ์ด ํ•„์š”ํ•˜๋‹ค๋ฉด SNS/SQS๋ฅผ ์„ค์ •ํ•ด์„œ ๋Œ€๊ธฐํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜์ ์ด๋‹ค.
์•„๋ฌดํŠผ ๊ทธ๊ฒŒ ์—†๋‹ค๋ฉด ์‹ค์ œ ์„ฑ๊ณต ๊ฒฝ๋กœ์— ํŒŒ์ผ์ด ๋–จ์–ด์งˆ ๋•Œ๊นŒ์ง€ ๊ธฐ๋‹ค๋ฆฌ๋ฉด ๋œ๋‹ค.

๊ทธ๋Ÿฌ๋ฉด ์ด๋ ‡๊ฒŒ ํŒŒ์ผ์ด ๋–จ์–ด์งˆ ๊ฒƒ์ด๋‹ค.

๊นŒ๋ณด๋ฉด ์‘๋‹ต๊ฐ’์ด ๋‚˜์˜จ๋‹ค.

๊ทธ๋ฆฌ๊ณ  Async Endpoint์˜ ๊ฒฝ์šฐ์—๋Š” ์‚ฌ์šฉ์ด ์—†์„๋•Œ ์ธ์Šคํ„ด์Šค๊ฐ€ 0์œผ๋กœ ๋‹ค์šด๋˜๋Š”, zero scale์ด ๊ฐ€๋Šฅํ•˜๋‹ค. (๋‹จ, t ์‹œ๋ฆฌ์ฆˆ๋Š” ์•ˆ๋จ)

์ด๋ ‡๊ฒŒ ๋งž์ถฐ๋†“์œผ๋ฉด


์•ˆ์“ธ๋•Œ 0๊ฐœ๋กœ ๋‚ด๋ ค๊ฐ„๋‹ค. ์ด๊ฒŒ ์ข€ ์ข‹๋‹ค.




์„œ๋ฒ„๋ฆฌ์Šค ์—”๋“œํฌ์ธํŠธ

๋˜ ๋งค์šฐ ๊ฐ€๋ฒผ์šด ์‚ฌ์šฉ์‚ฌ๋ก€๋ผ๋ฉด ๊ดœ์ฐฎ์€ ์˜ต์…˜ ์ค‘ ํ•˜๋‚˜๊ฐ€ ์ด๊ฑฐ๋‹ค.
Lambda ์ฒ˜๋Ÿผ ์™„์ „ํžˆ ์˜จ๋””๋งจ๋“œ๋ผ์„œ ํ”„๋กœ๋น„์ €๋‹ํ•  ํ•„์š”๊ฐ€ ์—†๊ณ , ์ปดํ“จํŒ… ์‹œ๊ฐ„๋‹น ๊ณผ๊ธˆ์„ ํ•œ๋‹ค.
๋ฉ”๋ชจ๋ฆฌ ์ •๋„๋งŒ ๋ฏธ๋ฆฌ ๋ช…์‹œํ•ด๋‘๋ฉด ์•Œ์•„์„œ ๋‚ด๋ถ€์—์„œ ํ™•์žฅํ•œ๋‹ค.

์ด๋ ‡๊ฒŒ ๋Œ€์ถฉ ๋งŒ๋“ค๋ฉด ๋œ๋‹ค.


์ด๊ฒŒ ์ฝœ๋“œ์Šคํƒ€ํŠธ๊ฐ€ ์ข€ ๊ธธ๋‹ค. 600MB ์งœ๋ฆฌ ๋ชจ๋ธ์„ 1GB ๋ฉ”๋ชจ๋ฆฌ์— ์˜ฌ๋ ธ๋”๋‹ˆ ์ฝœ๋“œ์Šคํƒ€ํŠธ๊ฐ€ 40-50์ดˆ ์ •๋„ ๊ฑธ๋ฆฌ๋”๋ผ.

๊ทธ๋ฆฌ๊ณ  1GB์งœ๋ฆฌ ์ตœ์†Œ์ŠคํŽ™์œผ๋กœ ํ•ด์„œ๋Š” ์„ฑ๋Šฅ์ด ์ข€ ๋งŽ์ด ๋”ธ๋ฆฌ๋Š” ํŽธ์ด๋‹ค.
Lambda์ฒ˜๋Ÿผ ๋ฉ”๋ชจ๋ฆฌ์— ๋น„๋ก€ํ•ด์„œ CPU๋ฅผ ํ• ๋‹นํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

1GB๋กœ ํ–ˆ์„๋•Œ


2GB๋กœ ํ–ˆ์„๋–„

๊ทผ๋ฐ ์ด๊ฒŒ ํ˜„์‹ค์ ์œผ๋กœ ์ข€ ๋งŽ์ด ๋น„์‹ธ๊ธฐ ๋•Œ๋ฌธ์—, ํ•œ๋‹ฌ์— ํ•œ๋ฒˆ ์ •๋„ ์ง„์งœ ์กฐ๊ธˆ์”ฉ ํ˜ธ์ถœํ•˜๋Š” ๊ฐ„ํ—์ ์ธ ์ผ€์ด์Šค๊ฐ€ ์•„๋‹ˆ๋ผ๋ฉด ์ถ”์ฒœํ•˜์ง€ ์•Š๋Š”๋‹ค.
๋ฌด์Šจ ๋ชจ๋ธ์ด CPU์—์„œ๋„ ํ•œ์ž๋ฆฟ์ˆ˜ ๋ฐ€๋ฆฌ์ดˆ ์ˆ˜์ค€์œผ๋กœ ๋น ๋ฅธ๊ฒŒ ์•„๋‹ˆ๋ฉด ์ŠคํŒŒ์ดํฌ ํŠธ๋ž˜ํ”ฝ์—๋„ ์ž˜ ๋งž์ง€ ์•Š๋Š”๋‹ค. CPU์—์„œ๋„ ์ดˆ ๋‹จ์œ„๋กœ ๋А๋ฆฐ๋ฐ ํ˜ธ์ถœ์ด ๋นˆ๋ฒˆํ•˜๋ฉด ๋น„์šฉ์ด ํญ๋ฐœํ•œ๋‹ค.
๋‚ด๊ฐ€ ๋ดค์„๋•Œ๋Š” ์‹คํŒจํ•œ ์„œ๋น„์Šค์˜ ํ•œ ํ˜•ํƒœ๋‹ค.

๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ํ˜„์‹ค์ ์ธ ์ถ”์ฒœ์•ˆ์€ Async Endpoint๋‹ค.



์ฐธ์กฐ
https://docs.aws.amazon.com/ko_kr/sagemaker/latest/APIReference/API_runtime_InvokeEndpoint.html