入门 · 14 分钟 · 更新于 2026-05-05

二维线性变换:把矩阵看成一次平面动作

从基向量、网格和面积的角度理解 2x2 矩阵,而不是把矩阵乘法只当作公式。

矩阵的两列决定两个基向量的新位置,也决定整张网格的变形。

先看基向量去哪里

一个 2x2 矩阵最直接的读法,不是先背四个数的位置,而是问它把两个基向量送到了哪里。第一列是 e1 的新位置,第二列是 e2 的新位置。只要这两个箭头确定下来,整张平面网格的命运也就确定了。

这件事解释了为什么矩阵乘向量可以写成列向量的线性组合。向量 (x, y) 原本表示“走 x 份 e1,再走 y 份 e2”。变换之后,只是把这两段路换成“走 x 份新 e1,再走 y 份新 e2”。公式背后是一个非常朴素的搬运过程。

如果你在纸上画一个正方形网格,再画出两个基向量变换后的位置,就可以手工预测任意点会被送到哪里。这个方法比直接代入公式慢一点,却能更快形成直觉。尤其在学习特征向量、行列式和可逆性时,这种图像会反复出现。

线性意味着两件事保持稳定

线性变换有两个不该被破坏的约定:原点仍然在原点,直线仍然是直线,并且平行线仍然平行。网格可以被拉伸、压缩、旋转、剪切,甚至翻面,但不会突然弯曲成波浪,也不会在局部撕裂。

这也是为什么线性代数适合描述“局部近似”。很多非线性现象在很小的范围内可以被一张线性地图近似:曲线表面上的一小块、神经网络某一层附近的变化、图像处理中一次局部变换,都可以借助矩阵来观察。

学习时可以反过来判断:如果一个动作让原点移动了,它是仿射变换,不是纯线性变换;如果一个动作让平行线不再平行,它也不是线性变换。这种排除法能帮你避免把所有几何操作都混成一类。

从图像回到计算

直觉不是为了替代计算,而是为了给计算安排意义。比如矩阵 [[2, 1], [0, 1]] 的第一列是 (2, 0),第二列是 (1, 1)。这说明水平单位箭头被拉到两倍,竖直单位箭头被斜着推到右上方。于是你不用乘很多点,也能知道它是一次水平拉伸加剪切。

再看 [[0, -1], [1, 0]],第一列是 (0, 1),第二列是 (-1, 0)。这正是把 e1 送到上方,把 e2 送到左方,所以它是逆时针旋转 90 度。公式和图像在这里完全一致。

当你能从列向量读出动作,再从动作猜出计算,线性代数就会从符号堆变成一套可检查的语言。后面的行列式、特征值和分解都可以沿着这条路继续理解。

一句话带走

读矩阵时先读两列:第一列是水平基向量的新位置,第二列是竖直基向量的新位置。