๐ "LLM ์์ด์ ํธ์ ์คํฌ์ ์ด์ ๋ ์ด์ '์์ผ๋ก ๋ง๋ ๋ค'๋ ์๋๊ฐ ๋๋ฌ๋ค โ ์ค์ค๋ก ์งํํ๋ ํ์ต ๊ธฐ์ ๋ก ๋ฐ๋๋ค!"
SkillOpt: Executive Strategy for Self-Evolving Agent Skills
๐๏ธ ์์: Microsoft Research (๋น ํ ํฌ)
๐ท๏ธ ํต์ฌ ํค์๋: skill optimization, text-space optimizer, self-evolving agent, bounded edits, validation-driven learning
๐ญ ์ด๋ฐ ์ง๋ฌธ์ ํด๋ณธ ์ ์๋์?
- โLLM ์์ด์ ํธ์ ์คํฌ์ ํฅ์์ํค๋ ค๋ฉด, ์ด๋ป๊ฒ ํด์ผ ํ ๊น?โ
- โ์ด๋ค ๋ฐฉ์์ผ๋ก ์คํฌ์ โํ๋ จโํด์ผ, ์ค์ ๋ก ์ฑ๋ฅ์ด ์ฌ๋ผ๊ฐ๊น?โ
- โ์คํฌ ์ ๋ฐ์ดํธ๊ฐ ์คํจํ ๋, ์ด๋ป๊ฒ ๋ณต๊ตฌํด์ผ ํ ๊น?โ
[ํต์ฌ ์ค๋ช : ๊ธฐ์กด์๋ ์คํฌ์ ์๋์ผ๋ก ์กฐ์ ํ๊ฑฐ๋, ํ ๋ฒ๋ง ์์ฑํ๊ฑฐ๋, ์ ํ๋ ์์จ ์งํ ๋ฐฉ์์ผ๋ก ๊ฐ์ ํ์ง๋ง, ์ด ๋ ผ๋ฌธ์ ํ ์คํธ ๊ณต๊ฐ์์ ๋ ๋ฆฝ์ ์ธ ์ต์ ํ ๋ชจ๋ธ์ ๋์ ํด, ์คํฌ ๋ฌธ์๋ฅผ โํธ์งโํ๋ ๋ฐฉ์์ผ๋ก ํ์ต์ ๊ตฌํํ์ต๋๋ค. ์ด ๋ฐฉ์์ ํ ์คํธ์์ ์ฑ๋ฅ์ด ํฅ์๋ ๋๋ง ์ ๋ฐ์ดํธ๋๋ฉฐ, ํ๋ จ ์ค์๋ ์ ํ ์ถ๋ก ์๊ฐ์ ๋ชจ๋ธ ํธ์ถ์ ์ฌ์ฉํ์ง ์์ต๋๋ค.]
ํนํ ์ฃผ๋ชฉํ ์ :
- GPT-5.5์์ ์ง์ ์ฑ๋ด ๋ชจ๋์์ ํ๊ท ์คํฌ ์์ด์ ์ ํ๋๋ฅผ +23.5 ํฌ์ธํธ ํฅ์
- Codex ์์ด์ ํธ ๋ฃจํ ๋ด์์ +24.8 ํฌ์ธํธ ํฅ์, Claude Code ๋ด์์๋ +19.1 ํฌ์ธํธ ํฅ์
- 52๊ฐ์ (๋ชจ๋ธ ร ๋ฒค์น๋งํฌ ร ์คํ ํ๊ฒฝ) ์ ์ค ๋ชจ๋ ์ ์์ ์ต๊ณ ๋๋ ๋๋ฅ ์ฑ๊ณผ, 7๊ฐ์ ํ๊ฒ ๋ชจ๋ธ๊ณผ 6๊ฐ์ ๋ฒค์น๋งํฌ์์ 1์๋ฅผ ์ฐจ์ง
๐ฏ ์ ์ด๊ฒ์ด ๊ฒ์ ์ฒด์ธ์ ์ธ๊ฐ? :
โ์คํฌ์ ์๋์ผ๋ก ์กฐ์ ํ๊ฑฐ๋, ํ๋ จ๋ ๋ชจ๋ธ์ ์์กดํ๋ ๋ฐฉ์โ โ โํ ์คํธ ๊ณต๊ฐ์์ ๋ ๋ฆฝ ์ต์ ํ ๋ชจ๋ธ์ด ์คํฌ ๋ฌธ์๋ฅผ ํธ์งํ๋ฉฐ, ์ฑ๋ฅ ํฅ์๋ง ์ธ์ ํ๋ ์๋ํ๋ ์งํ ์์คํ โ