Что в матрице строка а что столбец
Математика для чайников. Матрицы и основные действия над ними
Определение матрицы
Матрица – это прямоугольная таблица элементов. Ну а если простым языком – таблица чисел.
Обычно матрицы обозначаются прописными латинскими буквами. Например, матрица A, матрица B и так далее. Матрицы могут быть разного размера: прямоугольные, квадратные, также есть матрицы-строки и матрицы-столбцы, называемые векторами. Размер матрицы определяется количеством строк и столбцов. Например, запишем прямоугольную матрицу размера m на n, где m – количество строк, а n – количество столбцов.
Что можно делать с матрицами? Складывать/вычитать, умножать на число, умножать между собой, транспонировать. Теперь обо всех этих основных операциях над матрицами по порядку.
Операции сложения и вычитания матриц
Сразу предупредим, что можно складывать только матрицы одинакового размера. В результате получится матрица того же размера. Складывать (или вычитать) матрицы просто – достаточно только сложить их соответствующие элементы. Приведем пример. Выполним сложение двух матриц A и В размером два на два.
Вычитание выполняется по аналогии, только с противоположным знаком.
Умножение матрицы на число
На произвольное число можно умножить любую матрицу. Чтобы сделать это, нужно умножить на это число каждый ее элемент. Например, умножим матрицу A из первого примера на число 5:
Операция умножения матриц
И пример с реальными числами. Умножим матрицы:
Операция транспонирования матрицы
Транспонирование матрицы – это операция, когда соответствующие строки и столбцы меняются местами. Например, транспонируем матрицу A из первого примера:
Определитель матрицы
Определитель, о же детерминант – одно из основных понятий линейной алгебры. Когда-то люди придумали линейные уравнения, а за ними пришлось выдумать и определитель. В итоге, разбираться со всем этим предстоит вам, так что, последний рывок!
Определитель – это численная характеристика квадратной матрицы, которая нужна для решения многих задач.
Чтобы посчитать определитель самой простой квадратной матрицы, нужно вычислить разность произведений элементов главной и побочной диагоналей.
Определитель матрицы первого порядка, то есть состоящей из одного элемента, равен этому элементу.
А если матрица три на три? Тут уже посложнее, но справиться можно.
Для такой матрицы значение определителя равно сумме произведений элементов главной диагонали и произведений элементов лежащих на треугольниках с гранью параллельной главной диагонали, от которой вычитается произведение элементов побочной диагонали и произведение элементов лежащих на треугольниках с гранью параллельной побочной диагонали.
К счастью, вычислять определители матриц больших размеров на практике приходится редко.
От действий над матрицами к пониманию их сути…
Очень уважаю людей, которые имеют смелость заявить, что они что-то не понимают. Сам такой. То, что не понимаю, — обязательно должен изучить, осмыслить, понять. Статья «Математика на пальцах», и особенно матричная запись формул, заставили меня поделиться своим небольшим, но, кажется, немаловажным опытом работы с матрицами.
Лет эдак 20 назад довелось мне изучать высшую математику в вузе, и начинали мы с матриц (пожалуй, как и все студенты того времени). Почему-то считается, что матрицы — самая лёгкая тема в курсе высшей математики. Возможно — потому, что все действия с матрицами сводятся к знанию способов расчёта определителя и нескольких формул, построенных — опять же, на определителе. Казалось бы, всё просто. Но… Попробуйте ответить на элементарный вопрос — что такое определитель, что означает число, которое вы получаете при его расчёте? (подсказка: вариант типа «определитель — это число, которое находится по определённым правилам» не является правильным ответом, поскольку говорит о методе получения, а не о самой сути определителя). Сдаётесь? — тогда читаем дальше.
Сразу хочу сказать, что я не математик ни по образованию, ни по должности. Разве что мне интересна суть вещей, и я порой пытаюсь до них «докопаться». Так же было и с определителем: нужно было разобраться со множественной регрессией, а в этом разделе эконометрики практически всё делается через… матрицы, будь они неладны. Вот и пришлось мне самому провести небольшое исследование, поскольку ни один из знакомых математиков не дал внятного ответа на поставленный вопрос, изначально звучавший как «что такое определитель». Все утверждали, что определитель — это такое число, которое особым образом посчитано, и если оно равно нулю, то… В общем, как в любом учебнике по линейной алгебре. Спасибо, проходили.
Если какую-то идею придумал один человек, то другой человек должен быть в состоянии её понять (правда, для этого порой приходится вооружаться дополнительными знаниями). Обращение к «великому и могучему» поисковику показало, что «площадь параллелограмма равна модулю определителя матрицы, образованной векторами — сторонами параллелограмма». Говоря простым языком, если матрица — это способ записи системы уравнений, то каждое уравнение в отдельности описывает вектор. Построив из точки начала координат векторы, заданные в матрице, мы таким образом зададим в пространстве некоторую фигуру. Если наше пространство одномерное, то фигура — это отрезок; если двумерное — то фигура — параллелограмм, и так далее.
Получается, что для одномерного пространства определитель — это длина отрезка, для плоскости — площадь фигуры, для трёхмерной фигуры — её объём… дальше идут n-мерные пространства, вообразить которые нам не дано. Если объём фигуры (то есть определитель для матрицы 3*3) равен нулю, то это означает, что сама фигура не является трёхмерной (она может быть при этом двухмерной, одномерной или вообще представлять собой точку). Ранг матрицы — это истинная (максимальная) размерность пространства, для которого определитель не равен нулю.
Так, с определителем почти всё понятно: он определяет «объёмность» фигуры, образованной описанными системой уравнений векторами (хотя непонятно, почему его значение не зависит от того, имеем мы дело с исходной матрицей, или с транспонированной — возможно, транспонирование — это вид аффинного преобразования?). Теперь нужно разобраться с действиями над матрицами…
Если матрица — это система уравнений (а иначе зачем нам таблица каких-то цифр, не имеющих к реальности никакого отношения?), то мы можем с ней делать разные вещи. Например, можем сложить две строки одной и той же матрицы, или умножить строку на число (то есть каждый коэффициент строки умножаем на одно и то же число). Если у нас есть две матрицы с одинаковыми размерностями, то мы их можем сложить (главное, чтобы при этом мы не сложили бульдога с носорогом — но разве математики, разрабатывая теорию матриц, думали о таком варианте развития событий?). Интуитивно понятно, тем более что в линейной алгебре иллюстрациями подобных операций являются системы уравнений.
Однако в чём смысл умножения матриц? Как я могу умножить одну систему уравнений на другую? Какой смысл будет иметь то, что я получу в этом случае? Почему для умножения матриц неприменимо переместительное правило (то есть произведение матриц В*А не то что не равно произведению А*В, но и не всегда осуществимо)? Почему, если мы перемножим матрицу на вектор-столбец, то получим вектор-столбец, а если перемножим вектор-строку на матрицу, то получим вектор-строку?
Ну, тут уж не то что Википедия, — тут даже современные учебники по линейной алгебре бессильны дать какое-либо внятное объяснение. Поскольку изучение чего-либо по принципу «вы сначала поверьте — а поймёте потом» — не для меня, копаю в глубь веков (точнее — читаю учебники первой половины XX века) и нахожу интересную фразу…
Если совокупность обычных векторов, т.е. направленных геометрических отрезков, является трёхмерным пространством, то часть этого пространства, состоящая из векторов, параллельных некоторой плоскости, является двумерным пространством, а все векторы, параллельные некоторой прямой, образуют одномерное векторное пространство.
В книгах об этом напрямую не говорится, но получается, что векторам, параллельным некоторой плоскости, необязательно лежать на этой плоскости. То есть они могут находиться в трёхмерном пространстве где угодно, но если они параллельны именно этой плоскости, то они образуют двумерное пространство… Из приходящих мне на ум аналогий — фотография: трёхмерный мир представлен на плоскости, при этом вектору, параллельному матрице (или плёнке) фотоаппарата, будет соответствовать такой же вектор на картинке (при условии соблюдении масштаба 1:1). Отображение трёхмерного мира на плоскости «убирает» одно измерение («глубину» картинки). Если я правильно понял сложные математические концепции, перемножение двух матриц как раз и представляет собой подобное отражение одного пространства в другом. Поэтому, если отражение пространства А в пространстве В возможно, то допустимость отражения пространства В в пространстве А — не гарантируется.
Любая статья заканчивается в тот момент, когда автору надоедает её писать. Поскольку я не ставил перед собой цели объять необъятное, а исключительно хотел понять суть описанных операций над матрицами и то, как именно матрицы связаны с решаемыми мной системами уравнений, я не полез в дальнейшие дебри линейной алгебры, а вернулся к эконометрике и множественной регрессии, но сделал это уже более осознанно. Понимая, что и зачем я делаю и почему только так, а не иначе. То, что у меня получилось в этом материале, можно озаглавить как «глава о сути основных операций линейной алгебры, которую почему-то забыли напечатать в учебниках». Но ведь мы же не читаем учебников, правда? Если честно, когда я учился в университете, мне очень не хватало именно понимания затронутых здесь вопросов, поэтому я надеюсь, что, изложив этот непростой материал по возможности простыми словами, я делаю доброе дело и помогаю кому-то вникнуть в саму суть матричной алгебры, переведя операции над матрицами из раздела «камлание с бубном» в раздел «практические инструменты, применяемые осознанно».
Операции над матрицами
Линейная алгебра
Матрицы
Матрица размера m х n – это прямоугольная таблица чисел, содержащая m строк и n столбцов. Числа, составляющие матрицу, называются элементами матрицы.
Матрицы принято обозначать заглавными латинскими буквами, а элементы – теми же, но строчными буквами с двойной индексацией.
Например, рассмотрим матрицу А размерности 2 х 3:
Матрицы А и В одного размера (m х n ) называют равными, если они поэлементно совпадают, т.е. aij = bij для , т.е. для любых i и j (можно записать «i, j).
Матрица-строка – это матрица, состоящая из одной строки, а матрица-столбец – это матрица, состоящая из одного столбца.
Например, — матрица-строка, а
.
Квадратная матрица n-го порядка – это матрица, в число строк равно числу столбцов и равно n.
Например, — квадратная матрица второго порядка.
Диагональные элементы матрицы – это элементы, у которых номер строки равен номеру столбца (aij, i = j). Эти элементы образуют главную диагональ матрицы. В предыдущем примере главную диагональ образуют элементы a11= 3 и a22= 5.
Диагональная матрица – это квадратная матрица, в которой все недиагональные элементы равны нулю. Например, — диагональная матрица третьего порядка. Если при этом все диагональные элементы равны единице, то матрица называется единичной (обычно обозначаются буквой Е). Например,
— единичная матрица третьего порядка.
Матрица называется нулевой, если все ее элементы равны нулю.
Квадратная матрица называется треугольной, если все ее элементы ниже (или выше) главной диагонали равны нулю. Например, — треугольная матрица третьего порядка.
Операции над матрицами
Над матрицами можно производить следующие операции:
1. Умножение матрицы на число. Произведением матрицы А на число l называется матрица В = lА, элементы которой bij = laij для любых i и j.
Например, если , то
.
2. Сложение матриц. Суммой двух матриц А и В одинакового размера m х n называется матрица С = А + В, элементы которой сij = aij + bij для «i, j.
Например, если то
.
Отметим, что через предыдущие операции можно определить вычитание матриц одинакового размера: разность А-В = А + (-1)*В.
3. Умножение матриц. Произведением матрицы А размера m x n на матрицу В размера n x p называется такая матрица С, каждый элемент которой сij равен сумме произведений элементов i-й строки матрицы А на соответствующие элементы j-го столбца матрицы В, т.е. .
, то размер матрицы-произведения будет 2 x 3, и она будет иметь вид:
В этом случае матрица А называется согласованной с матрицей В.
На основе операции умножения для квадратных матриц определена операция возведения в степень. Целой положительной степенью А m (m > 1) квадратной матрицы А называются произведение m матриц, равных А, т.е.
Подчеркнем, что сложение (вычитание) и умножение матриц определены не для любых двух матриц, а только для удовлетворяющим определенным требованиям к своей размерности. Для нахождения суммы или разности матриц их размер обязательно должен быть одинаковым. Для нахождения произведения матриц число столбцов первой из них должно совпадать с числом строк второй (такие матрицы называют согласованными).
Рассмотрим некоторые свойства рассмотренных операций, аналогичные свойствам операций над числами.
1) Коммутативный (переместительный) закон сложения:
2) Ассоциативный (сочетательный) закон сложения:
3) Дистрибутивный (распределительный) закон умножения относительно сложения:
5) Ассоциативный (сочетательный) закон умножения:
Подчеркнем, что переместительный закон умножения для матриц в общем случае НЕ выполняется, т.е. AB ¹ BA. Более того, из существования AB не обязательно следует существование ВА (матрицы могут быть не согласованными, и тогда их произведение вообще не определено, как в приведенном примере умножения матриц). Но даже если оба произведения существуют, они обычно разные.
В частном случае коммутативным законом обладает произведение любой квадратной матрицы А на единичную матрицу того же порядка, причем это произведение равно А (умножение на единичную матрицу здесь аналогично умножению на единицу при умножении чисел):
Подчеркнем еще одно отличие умножения матриц от умножения чисел. Произведение чисел может равняться нулю тогда и только тогда, когда хотя бы одно из них равно нулю. О матрицах этого сказать нельзя, т.е. произведение ненулевых матриц может равняться нулевой матрице. Например,
Продолжим рассмотрение операций над матрицами.
4. Транспонирование матрицы представляет собой операцию перехода от матрицы А размера m x n к матрице А Т размера n x m, в которой строки и столбцы поменялись местами:
%.
Свойства операции транспонирования:
1) Из определения следует, что если матрицу транспонировать дважды, мы вернемся к исходной матрице: (A T ) T = A.
Определители матриц
Для каждой квадратной матрицы А вводится число |А|, которое называют ее определителем. Иногда его еще обозначают буквой D.
Это понятие является важным для решения ряда практических задач. Определим его через способ вычисления.
Для матрицы А первого порядка ее определителем называют ее единственный элемент |А| = D1 = а11.
Для матрицы А второго порядка ее определителем называют число, которое вычисляют по формуле |А| = D2 = а11* а22 – а21* а12
Для матрицы А третьего порядка ее определителем называют число, которое вычисляют по формуле
Оно представляет алгебраическую сумму, состоящую из 6 слагаемых, в каждое из которых входит ровно по одному элементу из каждой строки и каждого столбца матрицы. Для запоминания формулы определителя принято пользоваться так называемым правилом треугольников или правилом Сарруса (рисунок 6.1).
Определители более высоких порядков вычисляют рекуррентным способом, т.е. определитель четвертого порядка через определитель третьего порядка, определитель пятого порядка через определитель четвертого порядка и т.д. Для описания этого способа необходимо ввести понятия минора и алгебраического дополнения элемента матрицы (сразу же отметим, что сам способ, который будет рассмотрен далее, подходит и для определителей третьего и второго порядка).
МиноромМij элемента аij матрицы n-го порядка называют определитель матрицы (n-1)-го порядка, полученной из матрицы А вычеркиванием i-й строки и j-го столбца.
Каждая матрица n-го порядка имеет n 2 миноров (n-1)-го порядка.
Алгебраическим дополнением Aij элемента аij матрицы n-го порядка называют его минор, взятый со знаком (-1) ( i+ j) :
Например, если , то
;
и т.д.
Способ вычисления определителя состоит в следующем: определитель квадратной матрицы равен сумме произведений элементов любой строки (столбца) на их алгебраические дополнения:
(разложение по элементам i-й строки;
);
(разложение по элементам j-го столбца;
).
Отметим, что и в общем случае определитель треугольной матрицы равен произведению элементов главной диагонали.
Сформулируем основные свойства определителей.
1. Если какая-либо строка или столбец матрицы состоит из одних нулей, то определитель равен 0 (следует из способа расчета).
2. Если все элементы какой-либо строки (столбца) матрицы умножить на одно и то же число, то и ее определитель умножится на это число (также следует из способа расчета – на расчет алгебраических дополнений общий множитель не влияет, а все остальные слагаемые умножены именно на это число).
Замечание: за знак определителя можно выносить общий множитель именно строки или столбца (в отличие от матрицы, за знак которой можно выносить общий множитель всех ее элементов). Например, , но
.
3. При транспонировании матрицы ее определитель не изменяется: |А Т | = |А| (доказательство проводить не будем).
4. При перестановке местами двух строк (столбцов) матрицы ее определитель меняет знак на противоположный.
Для доказательства этого свойства вначале предположим, что переставлены две соседние строки матрицы: i-я и (i+1)-я. Для расчета определителя исходной матрицы осуществим разложение по i-й строке, а для определителя новой матрицы (с переставленными строками) – по (i+1)–й (которая в ней такая же, т.е. поэлементно совпадает). Тогда при расчете второго определителя каждое алгебраическое дополнение будет иметь противоположный знак, так как (-1) будет возводиться не в степень (i + j), а в степень (i + 1+ j), а в остальном формулы отличаться не будут. Таким образом, знак определителя изменится на противоположный.
Аналогичные рассуждения можно поменять для столбцов.
5. Если матрица содержит две одинаковые строки (столбца), то ее определитель равен 0.
6. Если элементы двух строк (столбцов) матрицы пропорциональны, то определитель равен 0.
Это свойство основано на предыдущем свойстве и выносе за скобку общего множителя (после выноса за скобку коэффициента пропорциональности в матрице будут одинаковые строки или столбцы, и в результате этот коэффициент будет умножаться на ноль).
7. Сумма произведений элементов любой строки (столбца) матрицы на алгебраические дополнения элементов другой строки (столбца) той же матрицы всегда равна 0: при i ¹ j.
8. Определитель матрицы не изменяется, если к элементам строки или столбца матрицы прибавить элементы другой строки (столбца), умноженные на одно и тоже число.
В самом деле, пусть к элементам i–й строки прибавляют элементы j-й строки, умноженные на l. Тогда элементы новой i–й строки примут вид
(aik + lajk, «k). Вычислим определитель новой матрицы разложением по элементам i-й строке (отметим, что алгебраические дополнения ее элементов при этом не изменятся):
Мы получили, что этот определитель не отличается от определителя исходной матрицы.
9. Определитель произведения матриц равен произведению их определителей: |АВ| = |А| * |В| (доказательство проводить не будем).
Рассмотренные выше свойства определителей используют для упрощения их вычисления. Обычно стараются преобразовать матрицу к такому виду, чтобы какой-либо столбец или строка содержали как можно больше нулей. После этого определитель легко найти разложением по этой строке или столбцу.
Обратная матрица
Из определения следует, что обратная матрица является квадратной матрицей того же порядка, что и матрица А.
Все числа, кроме нуля, имеют обратные числа.
Чтобы решить вопрос о том, имеет ли квадратная матрица обратную, необходимо найти ее определитель. Если определитель матрицы равен нулю, то такая матрица называется вырожденной, или особенной.
Необходимое и достаточное условие существования обратной матрицы: обратная матрица существует и единственна тогда и только тогда, когда исходная матрица невырожденная.
Докажем достаточность. Чтобы его доказать, необходимо просто описать способ вычисления обратной матрицы, который мы всегда сможем применить для невырожденной матрицы.
Итак, пусть |А| ¹ 0. Транспонируем матрицу А. Для каждого элемента А Т найдем алгебраическое дополнение и составим из них матрицу , которую называют присоединенной(взаимной, союзной):
.
Найдем произведение присоединенной матрицы и исходной . Получим
. Таким образом матрица В – диагональная. На ее главной диагонали стоят определители исходной матрицы, а все остальные элементы – нули:
Аналогично можно показать, что .
Если разделить все элементы матрицы на |А|, то будет получена единичная матрица Е.
Таким образом , т.е.
.
Итак, алгоритм вычисления обратной матрицы состоит из следующих шагов:
3. Найти алгебраические дополнения элементов транспонированной матрицы и построить присоединенную матрицу .
4. Вычислить обратную матрицу, разделив присоединенную матрицу на |А|.
1. Найдем определитель этой матрицы по правилу треугольников:
¹ 0.
Можно доказать следующие свойства обращения матриц:
Ранг матрицы
Минором k-го порядка матрицы А размера m х n называют определитель квадратной матрицы k-го порядка, которая получена из матрицы А вычеркиванием каких-либо строк и столбцов.
Из определения следует, что порядок минора не превосходит меньшего из ее размеров, т.е. k £ min
Рангом матрицы называют наивысший порядок отличных от нуля миноров этой матрицы (обозначают rang А, или r(А)).
Из определения следует, что
1) ранг матрицы не превосходит меньшего из ее размеров, т.е.
r(А) £ min
2) r(А) = 0 тогда и только тогда, когда матрица нулевая (все элементы матрицы равны нулю), т.е. r(А) = 0 Û А = 0;
3) для квадратной матрицы n-го порядка r(А) = n тогда и только тогда, когда эта матрица А невырожденная, т.е. r(А) = n Û |А| ¹ 0.
На самом деле, для этого достаточно вычислить только один такой минор (тот, который получен вычеркиванием третьего столбца (потому что в остальных будет присутствовать нулевой третий столбец, и поэтому они равны нулю).
Поскольку все миноры третьего порядка нулевые, r(А) £ 2. Так как существует ненулевой минор второго порядка, например,
Очевидно, что использованные нами приемы (рассмотрение всевозможных миноров) не подходят для определения ранга в более сложных случаях ввиду большой трудоемкости. Обычно для нахождения ранга матрицы используют некоторые преобразования, которые называют элементарными:
1). Отбрасывание нулевых строк (столбцов).
2). Умножение всех элементов строки или столбца матрицы на число, отличное от нуля.
3). Изменение порядка строк (столбцов) матрицы.
4). Прибавление к каждому элементу одной строки (столбца) соответствующих элементов другой строки (столбца), умноженных на любое число.
Если матрица А получена из матрицы B элементарными преобразованиями, то эти матрицы называют эквивалентными и обозначают А
Теорема. Элементарные преобразования матрицы не изменяют ее ранг.
Доказательство теоремы следует из свойств определителя матрицы. В самом деле, при этих преобразованиях определители квадратных матриц либо сохраняются, либо умножаются на число, не равное нулю. В результате наивысший порядок отличных от нуля миноров исходной матрицы остается прежним, т.е. ее ранг не меняются.
С помощью элементарных преобразований матрицу приводят к так называемому ступенчатому виду (преобразуют в ступенчатую матрицу), т.е. добиваются, чтобы в эквивалентной матрице под главной диагональю стояли только нулевые элементы, а на главной диагонали – ненулевые:
Ранг ступенчатой матрицы равен r, так как вычеркиванием из нее столбцов, начиная с (r + 1)-го и дальше можно получить треугольную матрицу r-го порядка, определитель которой будет отличен от нуля, так как будет представлять собой произведение ненулевых элементов (следовательно, имеется минор r-го порядка, не равный нулю):
Пример. Найти ранг матрицы
1). Если а11 = 0 (как в нашем случае), то перестановкой строк или столбцов добьемся того, чтобы а11 ¹ 0. Здесь поменяем местами 1-ю и 2-ю строки матрицы:
4). В полученной матрице две последние строки – нулевые, и их можно отбросить:
Получена ступенчатая матрица, состоящая из двух строк. Следовательно, r(A) = 2.