线性代数的第一堂课──矩阵乘法的定义


线性代数的第一堂课──矩阵乘法的定义

文章插图

本文转自周志成老师博客 ccjou.wordpress
美国数学教授克莱恩(Morris Kline)说:「矩阵理论在被创造前就已发展完善 。」 这句话让人一头雾水,要理清话中的涵意必须从矩阵的发展历史说起 。
十七至十九世纪中叶,数学活动在欧洲以飞快的速度朝着各个领域发展,此时关于「阵列」(简: 数组, array)运算的研究全部集中于行列式理论,矩阵理论并未随着行列式同步发展 。事实上,矩阵理论足足落后行列式两百年之久 。1850年,英国数学家西尔维斯特(James Joseph Sylvester)将矩形阵列命名为「矩阵」 (matrix),但他并未定义矩阵乘法 。1857年,英国数学家凯莱(Arthur Cayley)发表一篇被后世公认为近代矩阵理论和线性代数基石的论文〈矩阵理论备忘录〉( A Memoir on the Theory of Matrices ),他将矩阵从行列式抽离出来,视之为另一个数学物件,并且定义完备的矩阵代数运算 。
这段历史显示矩阵乘法──矩阵理论中最重要的一个代数运算──绝对不是如数学课本所述那般理所当然,矩阵乘法定义隐含深层的意义,否则为何众多优秀的数学家竟然看不出矩阵理当如此相乘 。今天我们事后诸葛,已然明了矩阵代数之所以迟至十九世纪中叶才诞生的最主要原因在于人们一直无法确定矩阵的本质与功用究竟为何 。

线性代数的第一堂课──矩阵乘法的定义

文章插图

阿瑟·凯莱被认为是矩阵论的奠基人
据我所知,不少高中学生曾经发明各式各样的创意矩阵乘法,例如,有人以下列方式计算两个同阶方阵的乘积:

线性代数的第一堂课──矩阵乘法的定义

文章插图

无疑地,这个矩阵乘法被视为数学上的无知,认真负责的老师立刻将它更正为

线性代数的第一堂课──矩阵乘法的定义

文章插图

前面这个被老师纠正的创意发明称为 「Hadamard 乘积」 。对于相同尺寸的矩阵(同为 m×n 阶矩阵) A 和 B,Hadamard乘积定义为如下所示,因此也称作「分元」(entrywise)乘积 。老师和课本指定的矩阵乘法称为一般矩阵乘积,也就是目前线性代数采用的「正规」运算方式 。

线性代数的第一堂课──矩阵乘法的定义

文章插图

【线性代数的第一堂课──矩阵乘法的定义】请读者仔细想想:除非你预先设定矩阵乘积的意义及其用途,否则何从判断这两种乘法的对错?多数学生想不出更好的辩驳理由,最后只能默默地接受这个看似无厘头的定义,并且相信老师的善意忠告:「大学线性代数会给大家一个清楚的交代 。」
大学线性代数果真就说清楚讲明白了吗?恐怕未必 。与其照本宣科重述一次高中数学课本给出的矩阵乘积定义,我们不妨寻思凯莱究竟根据什么理念设计矩阵乘法规则 。1894年,凯莱对苏格兰数学物理学家泰特(Peter Tait)道出引领他至矩阵记号的动机并非四元数(quaternion),而是源于行列式或为了方便表达线性方程:
我并不是从四元数得到矩阵的概念,它直接源自于行列式,或为了方便表示方程组

线性代数的第一堂课──矩阵乘法的定义

文章插图

1855年,凯莱正着手线性复合(composition)映射的研究 。「线性映射(linear mapping)」 涵盖许多数学主题,这需要作一番说明 。设定义域(domain) D 与值域(range) R 为具有加法和纯量乘法的集合,我们称 f: D→R 为线性映射,如果任意 x,y ∈ D 满足这两个条件:

线性代数的第一堂课──矩阵乘法的定义

文章插图

其中 为标量 。举一些常见的例子,比如,f1(x)=ax 的图形表现为平面上一条穿越原点的直线,它符合线性映射的要求 。但 f2(x)=ax+b(b≠0) 不是线性映射,它是线性映射再加上平移量 b,图形表现为一条未穿越原点的直线 。又如 f3(x,y)=ax+by 代表三维空间中穿越原点的一个平面,很容易验证 f3 满足上述线性映射定义 。微分与积分运算都是线性映射,因为下列微分与积分法则成立:

线性代数的第一堂课──矩阵乘法的定义

文章插图

而且

线性代数的第一堂课──矩阵乘法的定义

文章插图

矩阵的转置(transpose)运算也是线性映射 。考虑 f(A)=A^T,满足