Segment-Aware Transformer

1、摘要   Transformer对于序列建模是非常强大的。几乎所有最先进的语言模型和预先训练的语言模型都基于 Transformer 体系结构。然而,它仅仅使用标记位置索引区分顺序标记。论文中作者提出一个假设:更好的上下文表示是不是可以从Transform »

ERNIE-DOC: 超长文本Transformer

1、摘要   Transformer不适合处理长文件输入,因为,随着文本长度的增加,消耗的内存和时间是N2的指数级增加。也有很多学者,通过截断一个长文档或应用稀疏注意机制,在一定程度上可以解决上下文碎片问题,但起到的作用有限。在这篇文章中,作者提出了一个预训练 »

送给了不起的你一个小译红包封面

小译四岁啦~ 千帆过尽,感谢相随! 送给了不起的你一个小译红包封面~~~ 领取方法: 方法一:保存下方二维码/二维码截图,再使用微信扫描二维码领取 方法二:复制下方链接发送到微信里,再戳开领取 https://support.weixin.qq.com/cgi-bin/mmsup »

使用frp配置内网穿透

1 Frp介绍 frp 是一个开源、简洁易用、高性能的内网穿透和反向代理软件,支持 tcp, udp, http, https等协议。frp 项目官网是 https://github.com/fatedier/frp, frp工作原理 服务端运行,监听一个主端口,等待客户端的 »