高质量中文预训练模型集合
Arxiv今日(2023-06-02)最新论文
Arxiv今日(2023-06-01)最新论文
Arxiv今日(2023-05-31)最新论文
Arxiv今日(2023-05-30)最新论文
Arxiv今日(2023-05-29)最新论文
Arxiv今日(2023-05-26)最新论文
Arxiv今日(2023-05-25)最新论文
深度学习调参指南中文版
A Survey of Large Language Models
大语言模型的涌现能力:现象与解释
Prompts技巧工程完全指南
从HuggingFace仓库中批量下载模型和数据
在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs
大语言模型BLOOM推理工具测试
BLOOM 训练背后的技术
Zero-Shot Information Extraction via Chatting with ChatGPT
ChatGPT 调研报告
Inverse scaling can become U-shaped
ChatGPT 标注指南来了!数据是关键
Large Language Models Are Human-Level Prompt Engineers
用于大型Transformer的8-bit矩阵乘法介绍
LoRA: Low-Rank Adaptation of Large Language Models
Reinforcement Learning from Human Feedback (RLHF)详解
通向AGI之路:大型语言模型(LLM)技术精要
万字拆解,追溯ChatGPT各项能力的起源
深入理解语言模型的突现能力
Chain of Thought Prompting Elicits Reasoning in Large Language Models
Git速查表
Transformers-文本生成的解码方法介绍
Finetuned Language Models are Zero-Shot Learners
(转)BERT加速的N种方法
QQ浏览器搜索中的智能问答技术
GAIIC2022商品标题识别二等奖获奖解决思路
英文学术论文撰写投稿技巧
Language Models are Few-Shot Learners
使用Anaconda管理Python环境
(转)美团基于知识图谱的剧本杀标准化建设与应用
Revisiting Self-Training for Few-Shot Learning of Language Model
Learning to Prompt for Vision-Language Models
avatar
lonePatient
一个致力于记录技术的博客
Follow Me
公告
记录和分享一些学习和开源内容,若有任何问题可通过留言板或者微信公众号给我留言,谢谢!