๐ค GPT-5์ Gemini Robotics๋ฅผ ๊บพ์ ์์ ์คํ ๋ก๋ด ํ๋ ์ถ๋ก ๋ชจ๋ธ
MolmoAct2: Action Reasoning Models for Real-world Deployment
๐๏ธ ์์: Allen Institute for AI (Ai2)
๐ท๏ธ ํต์ฌ ํค์๋: Vision-Language-Action, Robot Deployment, Action Reasoning, Open Source
๐ญ ์ด๋ฐ ์ง๋ฌธ์ ํด๋ณธ ์ ์๋์?
"VLA ๋ก๋ด ๋ชจ๋ธ์ด ๋น์ผ ํ๋์จ์ด ์์ด, ์ง๊ธ ๋น์ฅ ์ค์ ํ์ฅ์ ๋ฐฐํฌ๋ ์ ์์๊น์?"
๊ธฐ์กด VLA ๋ชจ๋ธ๋ค์ ํด๋ก์ฆ๋์์ค์ด๊ฑฐ๋, ๋น์ผ ํ๋์จ์ด์ ๋ฌถ์ฌ ์๊ฑฐ๋, ์ถ๋ก ์ ์ง์ฐ์ด ๋๋ฌด ํฌ๋ค๋ ๋ฌธ์ ๊ฐ ์์์ต๋๋ค. MolmoAct2๋ ์ด ์ธ ๊ฐ์ง๋ฅผ ๋์์ ํด๊ฒฐํ ์์ ์คํ์์ค ํ๋ ์ถ๋ก ๋ชจ๋ธ๋ก, ๊ฐ์ค์นยทํ์ต ์ฝ๋ยท๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ๊ณต๊ฐํ์ต๋๋ค. ํต์ฌ ํ์ ์ธ MolmoThink๋ ์ฅ๋ฉด ๋ณํ๊ฐ ์๊ธด ์์ญ๋ง ์ฌ์์ธกํด ๊ธฐ์กด ์ถ๋ก ๋๋น ์ง์ฐ์ ๋ํญ ๋จ์ถํฉ๋๋ค.
ํนํ ์ฃผ๋ชฉํ ์ :
- 7๊ฐ ์๋ฎฌ๋ ์ด์ ยท์ค์ธ๊ณ ๋ฒค์น๋งํฌ์์ Pi-05 ์ํ
- MolmoER, 13๊ฐ ๊ตฌํ ์ถ๋ก ๋ฒค์น๋งํฌ์์ GPT-5ยทGemini Robotics ER-1.5 ๋ฅ๊ฐ
- 720์๊ฐ ์์ ์กฐ์ ๊ถค์ ๋ฐ์ดํฐ์ (์ญ๋ ์ต๋ ์คํ ์์ ๋ฐ์ดํฐ์ ) ๊ณต๊ฐ
- 3.3M ์ํ ๊ณต๊ฐยท์ฒดํ ์ถ๋ก ํนํ ํ์ต์ผ๋ก 5๊ฐ embodiment ์ง์
๐ฏ ์ ์ด๊ฒ์ด ๊ฒ์ ์ฒด์ธ์ ์ธ๊ฐ?
์ด์ : ์ค์ฉ์ VLA = ํด๋ก์ฆ๋ ์์ค ๋ ์ ๋ชจ๋ธ ์์กด โ ์ดํ: ์์ ์คํ ๋ชจ๋ธ์ด GPT-5๊ธ ์ฑ๋ฅ, ์ ๊ฐ ํ๋์จ์ด์์ ์ค์๊ฐ ๋ฐฐํฌ ๊ฐ๋ฅ