如何让 GPT-4 帮你写 Prompt?
Efficient Memory Management for Large Language Model Serving with PagedAttention
Continuous Batching:一种提升 LLM 部署吞吐量的利器
Colossal-LLaMA-2:千元预算半天训练,效果媲美主流大模型,开源可商用中文LLaMA-2
Lost in the Middle:How Language Models Use Long Contexts
提升LLM的两种方式对比:RAG vs Finetuning
如何工程化落地LLM:五类模式加速 AI 应用开发
Chat Markup Language
Claude 教你写 AI 提示词,可能是最专业的 AI 工程师写的提示工程教程
大语言模型在1688电商场景的算法实践
avatar
Weitang Liu
一个致力于记录技术的博客
Follow Me
公告
记录和分享一些学习和开源内容,若有任何问题可通过留言板或者微信公众号给我留言,谢谢!