基于PyTorch实现word2vec模型
Transformer原理和实现
self—attention
认识交叉熵损失
cw2vec Learning Chinese Word Embeddings with Stroke n-gram Information
PyTorch常用代码段
BERT-Pre-training of Deep Bidirectional Transformers for Language Understanding
Pytorch深度学习入门
如何找到一个好的学习率
周期性学习率(Cyclical Learning Rate)技术
avatar
lonePatient
一个致力于记录技术的博客
Follow Me
公告
记录和分享一些学习和开源内容,若有任何问题可通过留言板或者微信公众号给我留言,谢谢!