本讲主题是磁阻随机存储器(MRAM)。Yu 教授按四个部分展开(幻灯片日期 2024-11-21):① MTJ(磁性隧道结)的工作原理——所有 MRAM 技术共同的基本存储元件;② Field-MRAM(第一代,磁场写入式);③ STT-MRAM(第二代,自旋转移矩式,当今商用主流);④ SOT-MRAM(第三代,自旋轨道矩式,仍在研发中)。三代技术的存储元件相同,区别在于"怎么写"。

MTJ 由三层关键结构组成:自由铁磁层(free layer,磁化方向可翻转,存储数据)/ 隧穿氧化物势垒(tunnel oxide barrier,典型材料 MgO,厚度仅约 1 nm 量级)/ 钉扎铁磁层(pinned layer,磁化方向固定,作为参考)。读取时在叠层两端施加电压、测量隧穿电流:两层磁化平行(P)时电阻低、反平行(AP)时电阻高,即 RP < RAP,以高低阻态区分 "1/0"。
各层都极薄——磁性层仅几纳米,主要用溅射 / PVD(物理气相沉积)制备,需要极精确的沉积控制,工艺难度大。


真实生产中的 MTJ 远比"三层"复杂,自下而上依次为(括号内为纳米厚度):
底部大量辅助层的目的就是稳定钉扎层方向;磁性层典型材料含 CoFeB(钴铁硼)。课程层面只需掌握"三层关键结构 + 其余为辅助层"这一框架。

高低阻的根源是自旋相关的量子隧穿:磁性材料中自旋向上 / 向下电子的态密度(DOS)不对称。

实验上测量 MTJ 电阻随外加磁场的磁滞回线(横轴单位 Oe):钉扎层不动,自由层随外场取向翻转,得到高 / 低阻两个分支。隧穿磁阻比定义为:
TMR := (RAP − RP) / RP

| 年代 | 势垒 / 电极材料体系 | TMR |
|---|---|---|
| 1995 | Al₂O₃ 势垒 + NiFe 合金电极 | 约 20% |
| ~2001 | Al₂O₃ 势垒 + CoFe(B) 电极 | 60–70% |
| 2001–2002 | MgO 势垒 + CoFe(B) 电极(IBM 内部结果) | 140–220% |
| 2005 | MgO 体系 | 350%(290K) |
| 2008 | Ikeda 等(Hitachi / Tohoku 大学,APL) | 604%(on/off≈7,"超高"个例) |

Field-MRAM(第一代):单元 = MTJ + 选择晶体管 + 额外的写字线(write word line),写线与 MTJ 之间有介质隔离。写入靠写字线大电流产生的环形磁场(右手定则)翻转自由层,电流反向则磁场反向、写入相反数据;读时开启选择管测 MTJ 电阻,读写路径解耦。
STT-MRAM(第二代,当今主流):去掉写字线,读写共用同一路径(1T1R),写入时大电流直接流经 MTJ,靠自旋转移矩翻转;读电流远小于写电流。
| 对比项 | Field-MRAM | STT-MRAM |
|---|---|---|
| 写入机制 | 写字线电流产生磁场翻转自由层 | 自旋极化电流直接流经 MTJ 施加转矩 |
| 单元结构 | MTJ + 晶体管 + 写字线(写路径类 crossbar) | 1T1R,结构简单 |
| 半选干扰 | 有(行/列其他单元感受一半的场) | 无(未选单元晶体管截止) |
| 写电流缩放 | Isw ∝ 1/Volume,越缩越大 | Isw ∝ Volume,越缩越小 |
| 可缩放性 | 90~65nm 以下难以缩放 | 持续缩放至 14/16nm,路线图至 7nm |

器件剖面:写字线埋在 MTJ 正下方(之间有隔离),MTJ 接在 Metal3 附近,下方经 Via / Metal 连到 CMOS 选择晶体管。IBM 在 2000 年代初投入大量研发(Gallagher & Parkin, IBM J. Res. Develop. 2006)。

半选(half-select)干扰 00:18:13:写入场沿写线四周分布,同一行 / 列的其他单元也感受到一半的场。设计要求只有行 + 列两个场矢量叠加(交点处)才超过翻转阈值,遵循 astroid(星形线)开关边界 Hx2/3 + Hy2/3 = Hi2/3(Hi 为单畴元件的各向异性场)。靠近 astroid 边界时稳态间能垒消失,会引起自发翻转(误写)。

Toggle MRAM 的缓解方案 00:19:52:① 把磁体的硬轴相对字线/位线旋转 45°,使单独一条线的场不足以翻转,必须两条线先后作用;② 时序写入——先加 i1(行电流)使磁化部分偏转,再叠加 i2(列电流)继续旋转,最后撤 i1 完成完整翻转(a→e 五阶段);半选单元只经历单一电流,无法完成完整翻转。这是 Freescale/Everspin 商用 toggle MRAM 的核心原理。

IBM 于 2004–2005 年演示了 16Mb Field-MRAM(含外围电路):底层 CMOS 180 nm(7sf 工艺),芯片 7.9×10 mm,单元 1.42 µm²(阵列效率约 30%),读 / 写均 30 ns,Vdd 2.3–3.3 V 或 1.8 V。

对比要点:传统(Field)单元 20–30 F²,需要写字线 / 旁路线 / 包层(cladding);STT 单元仅 6 F²,结构简单。写电流标度律完全相反:Field 的 Isw ∝ 1/Volume,STT 的 Isw ∝ Volume——MTJ 越小写电流越小,随磁单元宽度缩小两条曲线交叉,STT 在小尺寸下电流持续下降(图中标注 STT-RAM Jc0 = 1.0×10⁶ A/cm²)。
发展史 00:27:22:2000 年代初芯片级演示以 Field-MRAM 为主(IBM 16Mb 等),2006–2008 年 STT-MRAM 兴起并出现 Mb 级演示,如今最大已达数 Gb 级。


STT = Spin-Transfer Torque(自旋转移矩),电流驱动开关,电流方向决定写 0/1(按幻灯片坐标:电流向上 → 自由层指左;电流向下 → 自由层指右)。写电流比读电流大约一个量级。它基于两个磁学现象:① MgO MTJ 中的巨隧穿磁阻(TMR~100–600%)→ 两个可区分的阻态;② 自旋极化电流向磁化施加转矩 → 可用电流写入。

详细机理 00:29:45:

微观图像:磁化矢量 M 在转矩作用下绕有效场 Heff 作进动(precession);存在"摩擦"转矩(阻尼,damping)使其回落,而自旋转移注入"负摩擦"转矩使进动幅度增大直至翻越。动力学由 LLG(Landau–Lifshitz–Gilbert)方程加 Slonczewski 项描述:
Ms·dθ/dt = −αγ(µ₀·Ms·H·sinθ + 2K·sinθ·cosθ) + η·(µB·I)/(eV)
I > Ith 时为主动开关(伴随阈值角 θth);电流脉冲结束时需 θ > θc 才能完成翻转,由此在给定脉宽 τ 下定义最小(临界)电流 Ic。若电流不够(未达阈值),撤掉电流后磁化回到原点——教授将其类比 SRAM 噪声 / 蝶形曲线的回稳行为;但接近阈值时叠加热噪声也可能完成翻转 → 开关本质上是概率性的。

MgO 体系的巨 TMR / STT 效应由 Butler et al. (PRB 2001) 与 Mathon et al. (PRB 2001) 理论预言,约三年后由 Parkin et al.(IBM)与 Yuasa et al. 在 (Co)Fe/MgO/(Co)Fe (001) MTJ 中实验证实(均发表于 Nature Materials 2004):单晶 MgO(001) 势垒 MR = 247%@20K / 180%@293K;织构 MgO(001) 势垒约 180%。

| 参数 | 影响 |
|---|---|
| Jc0(写临界电流密度) | 决定单元尺寸(晶体管驱动)与写速度 |
| TMR(读信号) | 读裕量与读速度 |
| Δ(热稳定性因子) | 数据保持、读干扰、存储容量、温度范围 |
| Vbd(MTJ 击穿电压) | 寿命与耐久 |
写电流公式:Ic0 = (2αAMs·tF·e / ηħ)·[HK + Hd/2],其中 HK = Hintrinsic + Hshape + …;热稳定性公式:Δ = Ms·HK·tF·A / (2kB·T) ∝ Ms²·tF²·A / (kB·T)(假设本征各向异性远小于形状各向异性)。

实测 Jc–脉宽关系分两个区:几 ns 以下为进动区(precession region),电流随脉宽缩短指数上升;约 10 ns 以上为热激活区(thermal activation region),满足 Jc = Jc0·[1 − (kBT/E)·ln(tp/t₀)]——脉冲越长,热涨落帮助翻转的概率越大,所需电流越低。实际工作点选在两区边界附近(进动区内工作电流太大)。
幻灯片结论:先进 MTJ 的平均写电流密度 Jc0 约 1–2 MA/cm²。教授补充:多数现有产品还做不到 1 MA/cm²——1 MA/cm² 属理想值,常见 4–6 MA/cm² 量级。

由于热扰动,STT 开关是随机过程:BER–写电压曲线显示,电压(电流)足够大时开关趋于确定(BER 降至 10⁻¹⁰~10⁻¹¹);电压偏小时时而成功时而失败。图中对比 10 ns 与 50 ns 脉宽:脉宽更长可在更低电压达到同样 BER(热激活帮助),与上一节"精确进动 vs 热辅助"图像一致(提问环节确认该测量不在进动区——进动区典型 <3–5 ns)。

Δ = Ea / kBT:双稳态间能垒相对热能的高度。室温 kBT ≈ 26 meV,故 Ea 需大于 1 eV 乃至更高;典型设计目标 Δ = 40~60。
保持测试方法:烘烤样品测失效时间,作 Arrhenius(1/kT)图外推。示例数据:120 / 140 / 160°C 三点拟合得 Ea = 1.84 eV,外推至 10 年 / 3 个月寿命线。

能垒越高(Δ 大、保持好)越难开关(Jc0 大)——二者在多数材料 / 结构中正相关,构成基本权衡;理想设计应落在"低 Jc0、高 Δ"角落。由此定义品质因数 FOM = Jc0 / Δ,越小越好。
数据图比较了四种自由层方案:单层 Co40Fe40B20 及其 SyF 版、单层 Co20Fe60B20 及其 SyF 版(SyF = 合成亚铁磁自由层),各方案落点各异(Jc0 0~10 MA/cm²,Δ 0~140 @100×200 nm²)。

驱动能力缩放(Drivability Scaling):MTJ 面积按 F² 缩小(长宽都缩),而晶体管驱动电流只随宽度 W(∝F)缩小 → 缩放对 STT 有利。量化示例(Jc=4 MA/cm²,Id=300 µA/µm,MTJ 尺寸 F×F):65 nm 节点需 W/L>10F 的晶体管才能驱动,22 nm 节点 4F 即可(对应单元面积 16–12F² → 8–6F² → 4F²)。但根本目标仍是把 Jc 降向 1 MA/cm²。

耐久性外推 00:53:53:耐久受 MgO 隧穿层介质击穿(TDDB)限制。测试方法:在高于正常写电压的多个应力电压下测击穿循环数(加速 TDDB),再外推到工作电压。关注尾部位(tail bit,1 ppm 最差位)与 t63(中位)两组数据;外推模型有 E 模型(log-线性直线,低压区更准)与 1/E 模型(带曲率,高压区更准),学界仍有争论。即便用保守的 E 模型,外推到约 0.7 V 工作电压时尾部位也可达约 10¹⁰ 次以上;没人能实测 10¹⁴⁻¹⁶ 次(需十年量级),必须靠外推。

STT-MRAM 有两种 "flavor":i-MTJ(面内磁化,前述讨论均属此类)与 p-MTJ(垂直磁化,磁化指上 / 下)。当今工业界全部采用 p-MTJ,原因有二:
工程挑战:需为 10 nm 级 p-MTJ 寻找 / 优化材料叠层与工艺。


制造挑战分四大类:① 叠层沉积(nm 级厚度 / Å 级控制、界面质量、MgO 均匀性);② 叠层图形化(刻蚀损伤影响 TMR / RA / Jc,要在 1 nm MgO 上停刻);③ TMR 比(MgO 界面、互混、晶向);④ RA 波动(MgO 厚度 / 化学计量 / 质量)。提升热稳定性与降低写电流密度的材料"旋钮"包括:形状 / 晶体 / 界面各向异性、SyF 自由层、热辅助写入等。

Grandis(小公司,约 2010 年前后,后被三星收购、成为三星 STT-MRAM 技术班底):90 nm 节点 256 kb 测试芯片,写电流约 200 µA、速度约 20 ns、耐久 10¹³,1T1R 结构,MTJ 位于 Metal4–Metal5 之间。
电阻分布 01:00:46:低阻态约 2 kΩ(σ≈4%)、高阻态约 4 kΩ(σ≈3%),TMR≈100%,Rhigh–Rlow 间隔 = 20σ。
耐久测试 01:01:45:实测 >10¹³ 次(真实工作条件),经 TDDB 应力外推 >10¹⁶ 次("无限耐久"),TMR 在 10¹³ 脉冲内无退化。


| 团队(发表) | 容量 / 节点 | 关键规格 |
|---|---|---|
| Tohoku 大学 CIES(IEDM 2018) | 128 Mb(4M×32b),40 nm CMOS / 37 nm p-MTJ | 单元 0.462×0.462 µm²,芯片 9.57×7.79 mm²,写 14 ns@1.2V / 7 ns@1.8V,读 30 ns@1.2V,耐久 >10¹⁰,保持 10 年@85°C(外推) |
| Samsung(IEDM 2019) | 1 Gb 嵌入式,28 nm FDSOI | 单元 0.036 µm²,−40~105°C 良率 >90%,保持 10 年@105°C,耐久 10¹⁰ |
| TSMC(ISSCC 2020) | 32 Mb 嵌入式,22 nm ULL CMOS | 单元 0.0456 µm²,读取 10 ns,保持 10 年@150°C,耐久 10⁶@1Mb |
| Intel(IEDM 2019) | 同一平台双版本(22 nm) | ① eNVM(eFlash 替代,MCU):MTJ 70–80 nm,保证保持;② L4 末级缓存:2 MB 阵列,MTJ ≤55 nm,写 20 ns / 读 4 ns,耐久 10¹²,保持仅 1 秒@110°C |
Tohoku 的 Endoh(远藤)教授是 STT 先驱之一。Intel 的双版本演示 01:04:36 尤其有启发性:两个版本仅 MTJ 直径不同——直径小则更易翻转、写更快但保持差,体现"按应用裁剪 MTJ 尺寸"的设计思想(L4 缓存方向的失效率可由 ECC 纠错兜底)。




量产现状:各大代工厂均已提供 STT-MRAM 商用工艺,主要在 22~28 nm:TSMC 16 Mb、Intel 54 Mb、Samsung Foundry 8 Mb、GlobalFoundries 40 Mb。相比 PCM / RRAM 只有部分公司提供,STT-MRAM 是"普遍可得"的嵌入式 eNVM。

两类应用规格的取舍 01:06:41:
| 应用定位 | 优化目标 | 代价 | 代表(节点 / 规格) |
|---|---|---|---|
| eFlash 替代(MCU、汽车级) | 保持:150°C、数年~10 年以上 | 耐久仅 10⁵–10⁶(够 eFlash 用) | GF 22nm FDSOI(写 200ns、>20 年@150°C);Intel 22nm FFL(on/off 2.8、MTJ 80×80nm、10 年@200°C);TSMC 16nm FinFET;Samsung 28nm(10 年@105°C) |
| 末级缓存(LLC) | 速度与耐久 | 保持仅秒~分钟 | GF 22nm(写 10ns、>10¹²、10s@125°C);IBM 14nm FinFET(写 4ns、>10¹⁰、1min@85°C);Intel 22nm FFL(写 20ns、10¹⁰、1s@110°C) |


TSMC @ISSCC 2024:16 nm FinFET 节点 STT-MRAM,MTJ 在 M4–M5 之间,位单元 0.0187 µm²,16 Mb macro、密度 16.5 Mb/mm²,读取 7.5 ns、写脉宽 20 ns,保持 1 min@125°C、耐久 1E12@25°C——典型 LLC 取向(TSMC 另有 eFlash 版本更早发表)。
Samsung @VLSI 2024:14 nm FinFET 128 Mb macro(7.157 mm²,91 MHz 读,0.60 V,17.88 Mb/mm²)。16 Mb 规格:−40~125°C、读 15 ns、写 100 ns、写能量 20 pJ/bit,耐久 1E12@−40°C 同时保持 10 年@150°C(读干扰 10 年@125°C,DPPM 1ppm)。


SOT = Spin-Orbit Torque(自旋轨道矩),尚无商用产品。三端器件:MTJ 自由层直接贴在一条重金属(heavy metal)SOT 沟道上——与 Field-MRAM 的区别在于写线与 MTJ 间无隔离、直接接触。

Canted(倾斜)SOT-MRAM(Tohoku 大学 Endoh 组提出):让 MTJ 椭圆的硬轴与 SOT 金属条之间存在一个倾斜角 φ(canting angle)来破缺对称,从而无需外加磁场、仅靠 SOT 沟道电流方向即可双向翻转。
超快开关(Honjo et al., IEDM 2019):φ=30° 的 canted SOT 器件在写脉宽低至 0.35 ns 时仍可靠开关(示波器测 FWHM 脉宽,约 ±800 mV),约 300 ps 量级开关已被演示。
SOT 现状汇总(Tohoku IEDM 2020 教程):首次在 300mm 55nm CMOS 衬底上集成 SOT 器件——0.35 ns 无场开关、Δ=70(保持 >10 年)、TMR 167%、400°C 耐热 1h;SOT-MRAM 单元 10 ns 无场开关、ΔR=140%。对比 IMEC(VLSI 2019,MHM 钴,0.30 ns,Δ=48)。
芯片演示(VLSI 2020):4 kB SOT-MRAM,55nm CMOS,SOT 器件 88×315 nm 椭圆 + 15° canting,2T-1SOT 单元(1.42×3.675 µm,很大),1.2 V,读 90 MHz / 写 60 MHz——演示性质,速度并不亮眼。





| 英文术语 | 中文 | 解释 |
|---|---|---|
| MRAM (Magnetoresistive RAM) | 磁阻随机存储器 | 利用 MTJ 高低阻态存储数据的非易失存储器 |
| MTJ (Magnetic Tunnel Junction) | 磁性隧道结 | 铁磁层/隧穿氧化层/铁磁层三明治结构,MRAM 的基本存储元件 |
| Free layer | 自由层 | 磁化方向可被写操作翻转的铁磁层,存储数据 |
| Pinned (reference) layer | 钉扎(参考)层 | 磁化方向被固定的铁磁层,作为读出参考 |
| Tunnel oxide barrier (MgO) | 隧穿氧化物势垒(氧化镁) | 约 1nm 厚的绝缘层,电子量子隧穿通道,决定电阻与 TMR |
| SAF (Synthetic Anti-Ferromagnet) | 合成反铁磁层 | CoFeB/Ru/CoFe 等组合结构,用于钉死参考层、对外场免疫 |
| CoFeB | 钴铁硼 | MTJ 电极的典型铁磁材料 |
| TMR (Tunneling Magneto-Resistance) | 隧穿磁阻比 | (RAP−RP)/RP;100% 对应 on/off 比 2,商用典型 100–200% |
| Parallel / Antiparallel (P/AP) | 平行/反平行态 | 两磁层磁化同向(低阻)/反向(高阻)的两个存储状态 |
| Spin-dependent tunneling | 自旋相关隧穿 | 隧穿电流取决于两侧同自旋可用态密度的量子效应 |
| DOS (Density of States) | 态密度 | 单位能量内的电子态数;磁性材料自旋上/下 DOS 不对称 |
| Field-MRAM | 磁场写入式 MRAM | 第一代:写字线电流产生磁场翻转自由层,电流不可缩放 |
| Half-select disturbance | 半选干扰 | 同行/列未选单元感受部分写入场而被误扰的问题 |
| Astroid curve | 星形线(开关边界) | Hx2/3+Hy2/3=Hi2/3,磁场写入的开关阈值曲线 |
| Toggle MRAM | 翻转式 MRAM | 硬轴转 45° 并用 i1/i2 时序逐步翻转、抑制半选的改进方案 |
| STT (Spin-Transfer Torque) | 自旋转移矩 | 自旋极化电流向磁化传递角动量、用电流直接写入的机理 |
| Precession | 进动 | 磁化矢量绕有效场旋转的运动;电流加大幅度直至翻转 |
| Damping | 阻尼 | 使进动衰减回稳的"摩擦"转矩;STT 相当于负阻尼 |
| LLG equation | LLG 方程 | Landau–Lifshitz–Gilbert(含 Slonczewski 项)磁化动力学方程 |
| Jc0 (critical switching current density) | 临界写电流密度 | 触发 STT 翻转的阈值电流密度,先进目标 1–2 MA/cm² |
| Thermal stability factor Δ | 热稳定性因子 | Δ=Ea/kBT,决定保持力,典型设计 40–60 |
| Figure of merit Jc0/Δ | 品质因数 | 写电流密度与热稳定性之比,越小越好 |
| Retention | 数据保持 | 断电后数据保存时间,用 Arrhenius 外推(如 10 年@85°C) |
| Endurance | 写耐久 | 可擦写循环数,受 MgO 介质击穿(TDDB)限制 |
| TDDB (Time-Dependent Dielectric Breakdown) | 时变介质击穿 | 介质在长期电应力下击穿;E 模型/1-E 模型用于寿命外推 |
| BER (Bit Error Rate) | 误码率 | 写操作失败概率;因热扰动 STT 开关具有随机性 |
| i-MTJ / p-MTJ (in-plane / perpendicular MTJ) | 面内/垂直磁化 MTJ | 磁化在膜面内/垂直膜面;p-MTJ 可用圆形单元、缩放更好,为业界主流 |
| Shape anisotropy | 形状各向异性 | 由元件形状(长宽比)决定的磁易轴取向来源 |
| eFlash replacement / eNVM | 嵌入式闪存替代 / 嵌入式非易失存储 | STT-MRAM 主要商用定位(MCU、汽车级,重保持轻耐久) |
| LLC (Last Level Cache) | 末级缓存 | STT/SOT-MRAM 的高速应用方向(重速度/耐久,保持仅秒~分钟) |
| 1T1R | 一晶体管一电阻单元 | STT-MRAM 阵列结构,晶体管隔离消除半选/潜行电流 |
| SOT (Spin-Orbit Torque) | 自旋轨道矩 | 第三代机理:重金属沟道电流经自旋轨道效应翻转相邻自由层 |
| Heavy metal (SOT channel) | 重金属(SOT 沟道) | 与自由层直接接触的写电流通道(强自旋轨道耦合材料) |
| Canted SOT / canting angle | 倾斜式 SOT / 倾斜角 | 让 MTJ 易轴与 SOT 沟道成角度以破缺对称、实现无外场写入 |
| Type X/Y/Z SOT | X/Y/Z 型 SOT | 按磁化与写电流方向关系分类;X/Z 需外场,Y 无场但慢 |
| FDSOI / FinFET / ULL | 全耗尽绝缘体上硅 / 鳍式晶体管 / 超低漏电工艺 | 各代工厂 STT-MRAM 所嵌入的逻辑平台 |
| W/L (transistor drivability) | 晶体管宽长比(驱动能力) | 决定可提供的写电流;缩放使所需 W/L 从 10F 降到 4F |