π "λ₯ μμΉκ° AI μμ΄μ νΈμ λλ₯Ό λ°κΎΌλ€? μ΄ λ Όλ¬Έμ΄ μ λΆ μλ €μ€ κ±°μΌ"
OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents
ποΈ μμ: Tencent Hunyuan (λΉ ν ν¬)
π·οΈ ν΅μ¬ ν€μλ: multimodal search, agentic RL, open recipe, trajectory synthesis, deep search
π μ΄λ° μ§λ¬Έμ ν΄λ³Έ μ μλμ?
- βAIκ° μ€μ€λ‘ κ²μνκ³ μ¦κ±°λ₯Ό νμΈν΄ λ¬Έμ λ₯Ό ν μ μλ€λ©΄, μ κ·Έκ±Έ 곡κ°νμ§?β
- βλ΄κ° μ°λ AI μμ΄μ νΈκ° βλ¨κ³μ μΆλ‘ βμ νλ €λ©΄, μ΄λ€ λ°μ΄ν°μ νΈλ μ΄λ λ μνΌκ° νμν κΉ?β
- βμκΈ°λ§μ κ²μ λꡬλ₯Ό λ§λ€κ³ μΆμλ°, μ½λμ λ°μ΄ν°κ° 곡κ°λ λ Όλ¬Έμ΄ μμκΉ?β
[ν΅μ¬ μ€λͺ : κΈ°μ‘΄μλ κ²μ μμ΄μ νΈκ° νμ΅μ© λ°μ΄ν°μ νΈλ μ΄λ νμ΄νλΌμΈμ λΉκ³΅κ°λ‘ μ μ§νλ©°, μ¬νμ΄ μ΄λ €μ λλ°, μ΄ λ Όλ¬Έμ μμ μ€ν μμ€ λ μνΌλ₯Ό 곡κ°ν΄ λꡬλ λμΌν μ±λ₯μ μ¬νν μ μκ² νμ΅λλ€.]
νΉν μ£Όλͺ©ν μ :
- 7κ°μ λ²€μΉλ§ν¬μμ νκ· 10ν¬μΈνΈ μ΄μμ μ±λ₯ ν₯μ, SearchVL-RL-8k λ°μ΄ν°μ κΈ°λ°
- μμ μ© λͺ¨λΈκ³Ό κ²½μ μμ€μ κ²°κ³Ό λ¬μ± β νΉν 8k RL λ°μ΄ν°μ μ κΈ°λ°μΌλ‘ ν λ€μ€ λ¨κ³ μΆλ‘ μ±λ₯
π― μ μ΄κ²μ΄ κ²μ 체μΈμ μΈκ°? :
βλΉκ³΅κ° λ°μ΄ν° + 볡μ‘ν νΈλ μ΄λ νμ΄νλΌμΈβ β βμ€ν μμ€ λ μνΌ + 36k SFT + 8k RL + μμ¨ λꡬ νκ²½β