Transformer Soundwave Evolution

About 103,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › tardis › zm › art
一文了解Transformer全貌（图解Transformer）
Sep 26, 2025 · 网上有关Transformer原理的介绍很多，在本文中我们将尽量模型简化，让普通读者也能轻松理解。 1. Transformer整体结构在机器翻译中，Transformer可以将一种语言翻译成 …
zhihu.com
https://www.zhihu.com › question
如何最简单、通俗地理解Transformer？ - 知乎
Transformer最开始应用于NLP领域的机器翻译任务，但是它的通用性很好，除了NLP领域的其他任务，经过变体，还可以用于视觉领域，如ViT（Vision Transformer）。这些特点 …
zhihu.com
https://www.zhihu.com › column
Transformer模型详解（图解最完整版） - 知乎
Transformer 的整体结构，左图Encoder和右图Decoder 可以看到 Transformer 由 Encoder 和 Decoder 两个部分组成，Encoder 和 Decoder 都包含 6 个 block。Transformer 的工作流程大体 …
zhihu.com
https://www.zhihu.com › question
如何从浅入深理解 Transformer？ - 知乎
Transformer升级之路：1、Sinusoidal位置编码追根溯源 Transformer升级之路：2、博采众长的旋转式位置编码猛猿：Transformer学习笔记一：Positional Encoding（位置编码）解密旋转位 …
zhihu.com
https://www.zhihu.com › question
Transformer模型怎么用于regression的问题？ - 知乎
回归问题概述 Transformer模型基础回归问题中的Transformer架构调整应用案例优化与技巧挑战与改进 1. 回归问题概述回归问题是监督学习中的一种任务，目标是预测一个连续值。这类问 …
zhihu.com
https://www.zhihu.com › question
深度学习中“Transformer”怎么翻译为中文？ - 知乎
Transformer 个人觉得不翻译为好。 Transformer按在机器翻译中原意可以翻译为变形器或变换器。但随着Transformer的普及，它已经成为一类以自注意力为主要部件的特定模型，其原本在机 …
zhihu.com
https://www.zhihu.com › tardis › zm › art
挑战 Transformer：全新架构 Mamba 详解
Sep 23, 2025 · 而就在最近，一名为 Mamba 的架构似乎打破了这一局面。与类似规模的 Transformer 相比， Mamba 具有 5 倍的吞吐量，而且 Mamba-3B 的效果与两倍于其规模的 …
zhihu.com
https://www.zhihu.com › question
MoE和transformer有什么区别和联系？ - 知乎
01. Transformer：像“万能翻译官”的神经网络 Transformer 是当今AI大模型（如ChatGPT）的核心架构，最初用于机器翻译，核心是自注意力机制（Self-Attention），能同时分析句子中所有词 …
zhihu.com
https://www.zhihu.com › question
Transformer 模型是如何想到的，背后的思路和启发点有哪些，有 …
1 Transformer的历史 NeurIPS（神经信息处理系统会议）始于1987年，最初名为NIPS（Neural Information Processing Systems）是人工智能和机器学习领域最具权威性和影响力的国际学术 …
zhihu.com
https://www.zhihu.com › question
Transformer不是编解码器都有的吗？为什么会发展出仅解/编码器 …
Transformer的核心部分，是右边的两个黑色实线框圈起来的两部分，左边是编码器（Encoder），右边是解码器（Decoder）。下图是 Transformer 用于中英文翻译的整体结 …

Pagination
- 1
- 2
- 3
- Next