Kayo Lu

深入理解 Attention 機制：從原理到實作

在深度學習的發展歷程中，Attention 機制（注意力機制）無疑是近十年來最具革命性的突破之一。從 2015 年首次被引入 Seq2Seq 模型，到 2017 年 Transformer 架構的誕生，再到今天的 GPT、BERT、ChatGPT，Attention 機制始終是這些模型的核心引擎。但 Attention 到底是什麼？它解決了什麼問題？數學原理是什麼？本文將從零開始，帶你完整理解 Attention 機制的來龍去脈，並用 Python 從頭實作一個完整的 Self-Attention 模組。

2026/04/24 · 631 words · 3 min read · 1

從零到一：PyTorch 卷積神經網路 (CNN) 全方位實戰指南

這是一篇超過 1000 字的深度技術指南，涵蓋了從數據預處理、CNN 架構設計、損失函數調整到模型評估的完整流程。適合想要深入理解 PyTorch 內部運作機制的開發者。

2026/04/24 · 138 words · 1 min read · 4

論文解析

論文解析 | Scheduling Algorithms for Multiprogramming in a Hard-Real-Time Environment

#Earliest-Deadline-First #Rate-Monotonic

#Scheduling Algorithms for Multiprogramming in a Hard-Real-Time Environment Author C. L. Liu, Project MAC, Massachusetts Institute of Technology Hames W. Layland, Jet Propulsion Laboratory,…

2026/04/23 · 2,442 words · 12 min read · 26

論文解析 | Scheduling Algorithms for Multiprogramming in a Hard-Real-Time Environment