高质量中文预训练模型集合
Arxiv今日(2023-03-24)最新论文
大语言模型BLOOM推理工具测试
Arxiv今日(2023-03-23)最新论文
BLOOM 训练背后的技术
Arxiv今日(2023-03-22)最新论文
Arxiv今日(2023-03-21)最新论文
Arxiv今日(2023-03-20)最新论文
Arxiv今日(2023-03-17)最新论文
Arxiv今日(2023-03-16)最新论文
Zero-Shot Information Extraction via Chatting with ChatGPT
ChatGPT 调研报告
ChatGPT 标注指南来了!数据是关键
Large Language Models Are Human-Level Prompt Engineers
用于大型Transformer的8-bit矩阵乘法介绍
LoRA: Low-Rank Adaptation of Large Language Models
通向AGI之路:大型语言模型(LLM)技术精要
万字拆解,追溯ChatGPT各项能力的起源
深入理解语言模型的突现能力
Chain of Thought Prompting Elicits Reasoning in Large Language Models
Git速查表
Transformers-文本生成的解码方法介绍
Finetuned Language Models are Zero-Shot Learners
(转)BERT加速的N种方法
QQ浏览器搜索中的智能问答技术
GAIIC2022商品标题识别二等奖获奖解决思路
英文学术论文撰写投稿技巧
Language Models are Few-Shot Learners
使用Anaconda管理Python环境
(转)美团基于知识图谱的剧本杀标准化建设与应用
Revisiting Self-Training for Few-Shot Learning of Language Model
Learning to Prompt for Vision-Language Models
(转)格局打开,带你解锁 prompt 的花式用法
(转)美团商品知识图谱的构建及应用
R-Drop-Regularized Dropout for Neural Networks
ConSERT-A Contrastive Framework for Self-Supervised Sentence Representation Transfer
Lexicon Enhanced Chinese Sequence Labelling Using BERT Adapter
(转)对比学习(Contrastive Learning):研究进展精要
An Analysis of Simple Data Augmentation for Named Entity Recognition
FixMatch:Simplifying Semi-Supervised Learning with Consistency and Confidence
avatar
lonePatient
一个致力于记录技术的博客
Follow Me
公告
记录和分享一些学习和开源内容,若有任何问题可通过留言板或者微信公众号给我留言,谢谢!