入门 · 14 分钟 · 更新于 2026-05-05

二维线性变换：把矩阵看成一次平面动作

从基向量、网格和面积的角度理解 2x2 矩阵，而不是把矩阵乘法只当作公式。

矩阵的两列决定两个基向量的新位置，也决定整张网格的变形。

先看基向量去哪里

一个 2x2 矩阵最直接的读法，不是先背四个数的位置，而是问它把两个基向量送到了哪里。第一列是 e1 的新位置，第二列是 e2 的新位置。只要这两个箭头确定下来，整张平面网格的命运也就确定了。

这件事解释了为什么矩阵乘向量可以写成列向量的线性组合。向量 (x, y) 原本表示“走 x 份 e1，再走 y 份 e2”。变换之后，只是把这两段路换成“走 x 份新 e1，再走 y 份新 e2”。公式背后是一个非常朴素的搬运过程。

如果你在纸上画一个正方形网格，再画出两个基向量变换后的位置，就可以手工预测任意点会被送到哪里。这个方法比直接代入公式慢一点，却能更快形成直觉。尤其在学习特征向量、行列式和可逆性时，这种图像会反复出现。

线性变换有两个不该被破坏的约定：原点仍然在原点，直线仍然是直线，并且平行线仍然平行。网格可以被拉伸、压缩、旋转、剪切，甚至翻面，但不会突然弯曲成波浪，也不会在局部撕裂。

这也是为什么线性代数适合描述“局部近似”。很多非线性现象在很小的范围内可以被一张线性地图近似：曲线表面上的一小块、神经网络某一层附近的变化、图像处理中一次局部变换，都可以借助矩阵来观察。

学习时可以反过来判断：如果一个动作让原点移动了，它是仿射变换，不是纯线性变换；如果一个动作让平行线不再平行，它也不是线性变换。这种排除法能帮你避免把所有几何操作都混成一类。

直觉不是为了替代计算，而是为了给计算安排意义。比如矩阵 [[2, 1], [0, 1]] 的第一列是 (2, 0)，第二列是 (1, 1)。这说明水平单位箭头被拉到两倍，竖直单位箭头被斜着推到右上方。于是你不用乘很多点，也能知道它是一次水平拉伸加剪切。

再看 [[0, -1], [1, 0]]，第一列是 (0, 1)，第二列是 (-1, 0)。这正是把 e1 送到上方，把 e2 送到左方，所以它是逆时针旋转 90 度。公式和图像在这里完全一致。

当你能从列向量读出动作，再从动作猜出计算，线性代数就会从符号堆变成一套可检查的语言。后面的行列式、特征值和分解都可以沿着这条路继续理解。

读矩阵时先读两列：第一列是水平基向量的新位置，第二列是竖直基向量的新位置。