๐ "๋ฅ ์์น๊ฐ ๋ชจ๋ธ์ โ๋โ๊ฐ ์๋๋ผ โ์โ์ด ๋๋ ์๊ฐ, ๊ฒ์์ด ๋ฌธ์ ํด๊ฒฐ์ ํต์ฌ์ด ๋ฉ๋๋ค"
OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents
๐๏ธ ์์: Tencent Hunyuan (๋น ํ ํฌ)
๐ท๏ธ ํต์ฌ ํค์๋: multimodal search, agentic reinforcement learning, open-source recipe, deep search, trajectory synthesis
๐ญ ์ด๋ฐ ์ง๋ฌธ์ ํด๋ณธ ์ ์๋์?
- โ๊ฒ์์ ๋จ์ํ ์ ๋ณด ์ฐพ๊ธฐ์ผ, ์ ์ด๋ ๊ฒ ๋ณต์กํ ๋ชจ๋ธ์ด ํ์ํ์ง?โ
- โ๋ด๊ฐ ์ฐ๋ ๋ชจ๋ธ์ด ๊ฒ์์ ์ด๋ป๊ฒ ํด์ผ ํ ์ง, ์ด๋ป๊ฒ ํ์ตํ๋์ง ๋ชจ๋ฅด๊ฒ ์ด.โ
- โ์๊ธฐ๋ง์ ๊ฒ์ ์์ด์ ํธ๋ฅผ ๋ง๋ค๊ณ ์ถ์๋ฐโฆ ๋ฐ์ดํฐ๋ ํธ๋ ์ด๋ ๋ฐฉ๋ฒ์ด ๋๋ฌด ๋ซํ ์์์.โ
๊ธฐ์กด์๋ ๊ฒ์์ด ๋ชจ๋ธ์ ๋ถ๊ฐ ๊ธฐ๋ฅ์ด์๊ณ , ํธ๋ ์ด๋ ๋ฐ์ดํฐ๋ ํ์ดํ๋ผ์ธ์ ๋น๊ณต๊ฐ๋ก ๋จ์ ์์์ง๋ง, ์ด ๋ ผ๋ฌธ์ โ๋ชจ๋ ๊ฑธ ์คํโํ ์ฒด๊ณ๋ฅผ ์ ์ํด, ๋๊ตฌ๋ ๋์ผํ ์ฑ๋ฅ์ ๋ด๋ ๋ฅ ์์น ์์ด์ ํธ๋ฅผ ์ฌํํ ์ ์๊ฒ ํ์ต๋๋ค.
ํนํ ์ฃผ๋ชฉํ ์ :
- 7๊ฐ์ ๋ฒค์น๋งํฌ์์ ํ๊ท 10์ ์ด์ ์ฑ๋ฅ ํฅ์
- SearchVL-SFT-36k, SearchVL-RL-8k ๋ฐ์ดํฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ จ โ RL ๋ฐ์ดํฐ๋ 8,000๊ฐ์ ํธ๋ ์ด๋ ํธ๋์ด ํฌํจ๋จ
๐ฏ ์ ์ด๊ฒ์ด ๊ฒ์ ์ฒด์ธ์ ์ธ๊ฐ? :
โ๋น๊ณต๊ฐ ๋ฐ์ดํฐ + ๋ณต์กํ ํ์ดํ๋ผ์ธ + ๊ฒ์ ์คํจ์ ๋ํ ๋ฌด๊ด์ฌโ โ โ์คํ ๋ฐ์ดํฐ + ํธ๋ ํฉ์ฑ + ํด ์คํจ์ ๋ํ ์ฅ์ ๋ฌผ ์ ๊ฑฐ ์๊ณ ๋ฆฌ์ฆโ