架构
状态空间模型(Mamba)
State-Space Model (Mamba)
一种用隐藏状态压缩序列信息的模型架构,计算量随长度线性增长,是 Transformer 注意力机制的替代方案。
架构
State-Space Model (Mamba)
一种用隐藏状态压缩序列信息的模型架构,计算量随长度线性增长,是 Transformer 注意力机制的替代方案。
We use cookies
Anonymous analytics help us improve the site. You can opt out anytime. Learn more