[AWS] EMR: Hadoop

AWS EMR์€ Elastic Map Reduce์˜ ์ค€๋ง๋กœ, ๋น…๋ฐ์ดํ„ฐ์šฉ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์‹œ์Šคํ…œ์„ ์ œ๊ณตํ•˜๋Š” ์„œ๋น„์Šค๋‹ค.

ํ•˜๋‘ก, SPARK, HBase, Presto ๋“ฑ์„ ์ œ๊ณตํ•œ๋‹ค.




๋น„์šฉ

https://aws.amazon.com/ko/emr/pricing/

EMR์€ EC2, EKS, Outposts, ์„œ๋ฒ„๋ฆฌ์Šค์˜ 4๊ฐ€์ง€ ๋ฐฉ์‹์œผ๋กœ ๋งค๋‹ˆ์ง•์„ ํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ, ๋ฐฉ๋ฒ•์— ๋”ฐ๋ผ ๋น„์šฉ์ด ๋‹ค ๋‹ค๋ฅด๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด ์ค‘์— ์„œ๋ฒ„๋ฆฌ์Šค๋Š” ์•„์ง ๋ฒ„์ง€๋‹ˆ์•„ ๋ฆฌ์ „์—์„œ๋งŒ ํ‰๊ฐ€ํŒ์˜ ํ˜•ํƒœ๋กœ ์ œ๊ณต๋˜๋Š”๋“ฏํ•˜๋‹ค.
https://pages.awscloud.com/EMR-Serverless-Preview.html



ํด๋Ÿฌ์Šคํ„ฐ ์ƒ์„ฑ

๋จผ์ € ํด๋Ÿฌ์Šคํ„ฐ๋ฅผ ์ƒ์„ฑํ•ด๋ณด์ž.
๋‚œ ํ•˜๋‘ก์„ ์‚ฌ์šฉํ•  ๊ฒƒ์ด๋‹ค.

์ธ์Šคํ„ด์Šค ์‚ฌ์ด์ฆˆ๋ฅผ ์ž˜ ๊ณ ๋ฅด๊ณ , ์ ‘์†ํ• ๋•Œ ์‚ฌ์šฉํ•  ํ‚ค ํŽ˜์–ด๋ฅผ ๋„ฃ์–ด์ค€๋‹ค.

๊ทธ๋Ÿผ ์ด๋Ÿฐ์‹์œผ๋กœ ์ƒ์„ฑ์ด ๋  ๊ฒƒ์ด๋‹ค.

์œ„์— ์ดˆ๋ก๊ธ€์”จ๊ฐ€ "๋Œ€๊ธฐ" ์ •๋„๋กœ ๋œจ๋ฉด, ์ž˜ ์ƒ์„ฑ๋œ ๊ฒƒ์ด๋‹ค.




์ ‘์†ํ•˜๊ธฐ

EMR์˜ ๊ฒฝ์šฐ์—๋Š” ์•„๋ฌด๋ฐ์„œ๋‚˜ public access๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋ณด์•ˆ ๊ทธ๋ฃน์— ๋“ค์–ด๊ฐ€์„œ ๋‚ด ์•„์ดํ”ผ๋กœ ssh ํฌํŠธ๋ฅผ ์ „๋ถ€ ์—ด์–ด์ฃผ๊ณ ,

์ € ํผ๋ธ”๋ฆญ dns๋กœ ssh ์—ฐ๊ฒฐ์„ ์‹œ๋„ํ•˜๋ฉด ๋œ๋‹ค.

ํ‚ค ํŽ˜์–ด๋„ ํ•„์š”ํ•˜๋‹ค.

๊ทธ๋ ‡๊ฒŒ ํ•ด์„œ ๋“ค์–ด๊ฐ€์ง€๋ฉด

์ž˜ ์„ธํŒ…๋œ ๊ฒƒ์ด๋‹ค.

์ด์ œ ์—ฌ๊ธฐ์„œ hadoop ํ™˜๊ฒฝ์œผ๋กœ ํ•จ๊ป˜ ์„ค์น˜๋œ ๋„๊ตฌ๋“ค์„ ์ „๋ถ€ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

๊ทธ๋ ‡๋‹ค.