基于大语言模型的AI Agents—Part 1
LLM推理加速
GPT最佳实践 - 提升Prompt效果的六个策略
ChatGPT提示快速指南
为什么现在大家都在用 MQA 和 GQA?
构建高性能Prompt之路——结构化Prompt
QLORA:Efficient Finetuning of Quantized LLMs
问答系统使用 Embedding 召回的局限及解决方案
在单个GPU上基于QLoRA微调LLaMA2模型
使用LLM构建AI Agents的正确姿势
avatar
Weitang Liu
一个致力于记录技术的博客
Follow Me
公告
记录和分享一些学习和开源内容,若有任何问题可通过留言板或者微信公众号给我留言,谢谢!