深度学习模型改进入门指南 2025年10月6日2025年9月27日 作者 Akira 本指南旨在帮助从已有模块出发进行改进或自研新模块,以提升模型性能(涨点)为目标。 核心:有针对性地提升模型某一 … 阅读更多
大语言模型基础:注意力机制、Transformer 2025年12月5日2024年6月3日 作者 Akira 深度学习笔记——大语言模型(LLM)基础:注意力机制、Transformer。持续更新! 1 注意力机制 【例 … 阅读更多