Arxiv今日论文 | 2026-04-22
你不知道的 Claude Code:架构、治理与工程实践
大模型数据合成新范式:2K样本打败30万,从特征空间精准狙击任务短板
mid-training:构建预训练与后训练之间的分布式桥梁
用"深度思考率"精准度量LLM推理质量
前沿大模型训练方法:深度解析与实践指南
AI Skills 生态系统深度解析:从 Prompt Engineering 到 Agentic 基础设施的范式跃迁
DART:通过梯度隔离解决Agentic RL中推理与工具使用的干扰问题
SRFT:基于熵感知的单阶段SFT-RL统一微调方法
Yunque DeepResearch:层次化多智能体深度研究框架
avatar
Weitang Liu
一个致力于记录技术的博客
Follow Me
公告
记录和分享一些学习和开源内容,若有任何问题可通过留言板或者微信公众号给我留言,谢谢!