20260626 AI 资讯快报
20260626 AI 资讯快报
2026-06-26 · 实时更新
DeepReinforce 开源 Agentic 编程系列模型 Ornith-1.0
DeepReinforce团队推出开源Agentic编程模型,基于与基座,采用自改进训练框架。模型涵盖9B至397B四种规格,在Terminal-Bench 2.1和SWE-Bench Verified基准上达到同级SOTA。旗舰397B版本得分77.5/82.4超越Claude Opus 4.7;35B MoE版以64.4分超越Qwen 3.5-397B。
腾讯混元开源 4B 参数手机 Agent 模型 PhoneBuddy
腾讯混元开源 4B手机Agent模型,同步推出PhoneWorld、PhoneHarness等5篇论文,系统覆盖环境、训练、执行、隐私与安全全链路。模型核心创新采用Real+Mock混合RL训练,将真实App与自建PhoneWorld mock环境结合,使4B模型在150项真机评测中多项指标超越GPT-5.4。
Mistral AI 推出新一代文档识别模型 Mistral OCR 4
Mistral AI 推出最新文档识别模型,支持横跨10个语族的170种语言,在OmniDocBench基准上获得93.07分。相比GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞品,模型输出更受人类青睐。模型在输出文本的同时可提供边框、区域分类和置信度评分,支持RAG语义分块等下游工作负载。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Linの博客!
评论
