[AWS] EMR: Hadoop
AWS EMR์ Elastic Map Reduce์ ์ค๋ง๋ก, ๋น
๋ฐ์ดํฐ์ฉ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ
์ ์ ๊ณตํ๋ ์๋น์ค๋ค.
ํ๋ก, SPARK, HBase, Presto ๋ฑ์ ์ ๊ณตํ๋ค.
๋น์ฉ
https://aws.amazon.com/ko/emr/pricing/
EMR์ EC2, EKS, Outposts, ์๋ฒ๋ฆฌ์ค์ 4๊ฐ์ง ๋ฐฉ์์ผ๋ก ๋งค๋์ง์ ํ ์ ์๋๋ฐ, ๋ฐฉ๋ฒ์ ๋ฐ๋ผ ๋น์ฉ์ด ๋ค ๋ค๋ฅด๋ค.
๊ทธ๋ฆฌ๊ณ ์ด ์ค์ ์๋ฒ๋ฆฌ์ค๋ ์์ง ๋ฒ์ง๋์ ๋ฆฌ์ ์์๋ง ํ๊ฐํ์ ํํ๋ก ์ ๊ณต๋๋๋ฏํ๋ค.
https://pages.awscloud.com/EMR-Serverless-Preview.html
ํด๋ฌ์คํฐ ์์ฑ
๋จผ์ ํด๋ฌ์คํฐ๋ฅผ ์์ฑํด๋ณด์.
๋ ํ๋ก์ ์ฌ์ฉํ ๊ฒ์ด๋ค.
์ธ์คํด์ค ์ฌ์ด์ฆ๋ฅผ ์ ๊ณ ๋ฅด๊ณ , ์ ์ํ ๋ ์ฌ์ฉํ ํค ํ์ด๋ฅผ ๋ฃ์ด์ค๋ค.
๊ทธ๋ผ ์ด๋ฐ์์ผ๋ก ์์ฑ์ด ๋ ๊ฒ์ด๋ค.
์์ ์ด๋ก๊ธ์จ๊ฐ "๋๊ธฐ" ์ ๋๋ก ๋จ๋ฉด, ์ ์์ฑ๋ ๊ฒ์ด๋ค.
์ ์ํ๊ธฐ
EMR์ ๊ฒฝ์ฐ์๋ ์๋ฌด๋ฐ์๋ public access๊ฐ ๊ฐ๋ฅํ๋ค.
๋ณด์ ๊ทธ๋ฃน์ ๋ค์ด๊ฐ์ ๋ด ์์ดํผ๋ก ssh ํฌํธ๋ฅผ ์ ๋ถ ์ด์ด์ฃผ๊ณ ,

์ ํผ๋ธ๋ฆญ dns๋ก ssh ์ฐ๊ฒฐ์ ์๋ํ๋ฉด ๋๋ค.
ํค ํ์ด๋ ํ์ํ๋ค.
๊ทธ๋ ๊ฒ ํด์ ๋ค์ด๊ฐ์ง๋ฉด
์ ์ธํ
๋ ๊ฒ์ด๋ค.
์ด์ ์ฌ๊ธฐ์ hadoop ํ๊ฒฝ์ผ๋ก ํจ๊ป ์ค์น๋ ๋๊ตฌ๋ค์ ์ ๋ถ ์ฌ์ฉํ ์ ์๋ค.
๊ทธ๋ ๋ค.