为什么现在大家都在用 MQA 和 GQA?
构建高性能Prompt之路——结构化Prompt
QLORA:Efficient Finetuning of Quantized LLMs
问答系统使用 Embedding 召回的局限及解决方案
在单个GPU上基于QLoRA微调LLaMA2模型
使用LLM构建AI Agents的正确姿势
InstructBLIP:Towards General-purpose Vision-Language Models with Instruction Tuning
ReAct:Synergizing Reasoning and Acting in Language Models
Instruction Tuning 阶段性总结
比LLM更重要的多模态学习