π "λ₯ μμΉκ° AI μμ΄μ νΈμ ν΅μ¬μ΄λΌλ©΄, μ΄ λ Όλ¬Έμ κ·Έ κΈ°μ μ λꡬλ 볡μ ν μ μκ² ν΄μ€λ€!"
OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents
ποΈ μμ: Tencent Hunyuan (λΉ ν ν¬)
π·οΈ ν΅μ¬ ν€μλ: multimodal search, agentic RL, open-source recipe, deep search, trajectory synthesis
π μ΄λ° μ§λ¬Έμ ν΄λ³Έ μ μλμ?
- βAIκ° μ€μ€λ‘ κ²μν΄μ λ΅μ μ°Ύμλ΄λ κ² μ§μ§ κ°λ₯ν κΉ?β
- βλ΄κ° μ°λ AI μμ΄μ νΈκ° μ νμ βμ§§μ λ΅λ³βλ§ λ΄λλ κ±ΈκΉ?β
- βκ²μ κΈ°μ μ΄ κ°μ λλλ°, μ μ€μ μ¬μ©μμκ²λ ν° λ³νκ° μμκΉ?β
[ν΅μ¬ μ€λͺ : κΈ°μ‘΄μλ κ²μ λ°μ΄ν°μ νΈλ μ΄μ ν 리 ν©μ± νλ‘μΈμ€κ° λΉκ³΅κ°μ¬μ μ¬ν λΆκ°λ₯νμΌλ, μ΄ λ Όλ¬Έμ μμ μ€ν μμ€ λ μνΌλ‘ λͺ¨λ κ³Όμ μ 곡κ°ν¨]
νΉν μ£Όλͺ©ν μ :
- 7κ° λ²€μΉλ§ν¬μμ νκ· 10ν¬μΈνΈ μ΄μ μ±λ₯ ν₯μ (SearchVL-SFT-36k, SearchVL-RL-8k κΈ°λ°)
- νΉμ κ³Όμ μμ μμ© ν리미μ λͺ¨λΈκ³Ό λλ±ν μ±κ³Ό λ¬μ± (RL νμ΅ λ°μ΄ν° 8k건 κΈ°μ€)
π― μ μ΄κ²μ΄ κ²μ 체μΈμ μΈκ°? :
βλΉκ³΅κ° λ°μ΄ν° + 볡μ‘ν νΈλ μ΄μ ν 리 ν©μ±β β βμ€ν μμ€ λ μνΌ + 36k/8k λ°μ΄ν°μ + ν΄ νκ²½ ν΅ν©β