ECE 6465:Memory Device Technologies and Applications

Georgia Tech · Shimeng Yu 教授 · 2024 秋 · 28 个视频 · 约 29 小时 · YouTube 播放列表

课程简介

本课程是 Georgia Tech 研究生课程 ECE 6465,系统讲授半导体存储器的器件原理、电路设计与工艺技术:从 CMOS 基础与产业格局出发,依次深入传统三大存储器 SRAM、DRAM、FLASH 的单元结构、阵列组织与微缩演进,再覆盖 RRAM、PCM、MRAM、铁电四类新兴非易失存储器的物理机理与产业化原型,最后延伸到存内计算(CIM/PIM)与存储阵列外围电路设计。课程紧扣应用驱动——AI/LLM 时代的带宽与能效需求(HBM、3D NAND、3D V-Cache 等均有实例剖析),适合微电子、集成电路与计算机体系结构方向的研究生、工程师,以及希望系统理解存储技术全貌的自学者。本笔记按讲组织为 13 个页面,每页包含课程截图、可点击的 YouTube 时间戳跳转和中英对照术语表,建议按编号顺序阅读,也可直接跳到感兴趣的技术专题。

LECTURE 0 · 1 视频 · 19 分钟

课程管理与导论

课程结构、评分(作业50%/期中25%/期末25%)、教材与 16 周日程
LECTURE 1 · 2 视频 · 1.3 小时

存储器技术概览

存储层次结构、Memory Wall、LLM 带宽需求、阵列效率与 F² 单元面积、Westmere/Zen/A100/H100 实例
LECTURE 2 · 2 视频 · 1 小时

CMOS 基础与产业格局

MOSFET 物理、60mV/dec 亚阈值极限、微缩路线(FinFET→GAA→CFET)、存储器市场与公司排名演变
LECTURE 3 · 5 视频 · 5.5 小时

SRAM

6T 单元、蝶形曲线与 SNM、β/γ ratio、可靠性(RTN/NBTI/软错误)、FinFET SRAM、DTCO 与 3D V-Cache
LECTURE 4 · 5 视频 · 4.9 小时

DRAM

1T1C 与电荷分享、DDR 协议与带宽、刷新与 Row Hammer、电容工艺微缩(8F²→6F²)、HBM/GDDR、eDRAM 与 3D DRAM
LECTURE 5 · 4 视频 · 5 小时

FLASH 闪存

浮栅物理、FN 隧穿编程/擦除、NOR vs NAND、MLC/TLC/QLC、2D→3D NAND 工艺演进与历代芯片
LECTURE 6 · 2 视频 · 2.3 小时

新兴存储器

STT-MRAM/PCM/RRAM/铁电四类机理与十技术对比、1T1R 与 crossbar、选择器、3D XPoint 案例
LECTURE 7 · 1 视频 · 1.3 小时

存内计算

TPU/脉动阵列、SRAM/RRAM 模拟 CIM、电荷域与数字 CIM、DRAM PIM、能效对比(88 TOPS/W 等)
LECTURE 8 · 2 视频 · 1.5 小时

阵列设计

译码器/字线驱动/位线 MUX、位线 RC 延迟、电压/电流型灵敏放大器、Bank 组织与 NVSim 工具
LECTURE 9 · 1 视频 · 1.3 小时

RRAM

氧空位细丝机理、OxRAM vs CBRAM、保持/耐久表征、ITRI/IMEC/TSMC/Intel 原型芯片
LECTURE 10 · 1 视频 · 1.2 小时

PCM

GST 相变机理、RESET 电流挑战、漂移与多值、选通方案、Samsung 8Gb 与 3D XPoint
LECTURE 11 · 1 视频 · 1.3 小时

MRAM

MTJ 与 TMR、Field vs STT 写入、Jc0–Δ 权衡、Samsung/TSMC 嵌入式 MRAM、SOT-MRAM
LECTURE 12 · 1 视频 · 1.4 小时

铁电存储器

铁电极化与 LGD 理论、PUND 表征、HfO2 铁电、FeRAM/FeFET/FTJ、3D Fe-VNAND

知识体系速览

整门课的主线是存储层次金字塔:越靠近 CPU 越快也越贵——SRAM 速度最快(亚纳秒)但 6T 单元面积大(>100 F²),只能做片上缓存;DRAM 以 1T1C 单元换来约 6 F² 的密度与适中的延迟,承担主存角色,但电荷易失需要不断刷新;FLASH 凭浮栅/电荷俘获实现非易失与最高密度(3D NAND 已堆叠数百层),代价是微秒级以上的读写延迟与有限的擦写寿命。三者各居其位,没有一种技术能同时赢下速度、密度、功耗、可靠性这四角权衡——这正是每讲反复出现的核心矛盾:SRAM 与工艺微缩搏斗于噪声裕度与漏电,DRAM 受制于电容微缩与 Row Hammer,FLASH 则在多值化(MLC→QLC)中不断透支可靠性。

DRAM 与 FLASH 之间存在三个数量级的延迟鸿沟,新兴存储器(RRAM、PCM、MRAM、铁电)正是冲着这个 Storage Class Memory 空隙而来:它们都是非易失、可字节寻址、潜在高密度(可做 crossbar 与 3D 堆叠),各自依托不同的物理机理——氧空位细丝、相变、磁隧穿结、铁电极化。课程用统一的指标体系(写电压/能耗/速度、耐久、保持、单元面积)对十种技术做横向对比,并以 Intel/Micron 的 3D XPoint 从惊艳到退场为案例,说明产业化既取决于器件物理也取决于成本与生态。

把这一切重新搅动起来的是应用驱动:AI/LLM 推理本质上是带宽受限问题,Memory Wall 取代算力成为瓶颈。这催生了 HBM 的 3D 堆叠封装、GDDR 的极致 IO、3D V-Cache 的缓存扩容,也催生了更激进的范式转变——存内计算(CIM/PIM):让乘加运算直接发生在 SRAM/RRAM/DRAM 阵列内部,用模拟电荷域或数字方式把数据搬运的能耗降低一到两个数量级。理解从器件物理(Lecture 2–6、9–12)到阵列与外围电路(Lecture 8)再到系统应用(Lecture 1、7)的这条完整链路,正是本课的价值所在。