Forma kwadratowa (funkcjonał kwadratowy) – wielomianjednorodny II stopnia zmiennych określony na przestrzeni liniowej – zmienne występują tu najwyżej w drugiej potędze; ogólna postać[1]:
gdzie:
– stałe współczynniki liczbowe – całkowite, wymierne, rzeczywiste lub zespolone,
– zmienne, współrzędne dowolnego wektora danej przestrzeni liniowej
jednorodność II stopnia oznacza, że dla dowolnej liczby zachodzi równość,
W przypadku jednej zmiennej, dwóch zmiennych oraz trzech zmiennych formy nazywa się odpowiednio unarną, binarną i ternarną. Mają one postacie:
Uwaga: O ile nie zaznaczono inaczej, w artykule rozpatruje się przestrzenie liniowe nad ustalonym ciałemcharakterystyki różnej od 2.
Historia
Pytania, czy jakaś liczba całkowita spełnia zadaną formę kwadratową, zadawano wiele stuleci temu. Przykładem jest teoria Fermata o sumie dwóch kwadratów, która określa, kiedy istnieje liczba całkowita spełniająca formę gdzie – liczby całkowite. Problem ten jest analogiczny do znajdowania trójek pitagorejskich, który pojawił się w drugim tysiącleciu p.n. Chr.[b]
W 628, Hinduski matematyk Brahmagupta napisał dzieło Brāhmasphuṭasiddhānta zawierające m.in. wyniki badań równań typu W szczególności znalazł rozwiązanie równania (zwanego dziś równaniem Pella) [c]. W Europie problem ten badali Brouncker, Euler i Lagrange.
W 1801 Gauss opublikował dzieło Disquisitiones Arithmeticae, w którym główną część poświęcił teorii binarnych form kwadratowych o współczynnikach całkowitych. Jego idee zostały uogólnione i z czasem odkryto związki z liczbowymi ciałami kwadratowymi, z grupami modularnymi i innymi działami matematyki.
Forma kwadratowa a forma dwuliniowa
Tw. 1 Każdej formie kwadratowej[d][e] odpowiada wzajemnie jednoznacznie symetryczna forma dwuliniowa określona na tej samej przestrzeni, tak że zachodzą związki
Np.
(a) formą dwuliniową dodatnio określoną i symetryczną jest iloczyn skalarny wektorów
(b)formą kwadratową odpowiadająca jednoznacznie iloczynowi skalarnemu jest iloczyn skalarny wektora przez samego siebie – definiuje on kwadrat normy, która określa długości wektorów przestrzeni liniowej:
Df. Funkcję nazywa się formą dwuliniową odpowiadającą formie (stowarzyszoną z formą ).
Czynnik jest powodem, dla którego wyklucza się ciała, w których formy kwadratowe w ciałach charakterystyki 2 opisano w oddzielnej sekcji.
Wybór bazy a przedstawienie formy
Jeżeli jest przestrzenią liniową skończonego wymiaru to wybór bazy przestrzeni prowadzi do przedstawienia w postaci jednorodnego wielomianu kwadratowego[f]. Z drugiej strony dowolny jednorodny wielomian II stopnia zadaje we współrzędnych pewnej bazy formę kwadratową na [g].
Własności
Tw. Forma dwuliniowa jest symetryczna.
Df. Formy kwadratowe nazywa się równoważnymi, jeśli równoważne są odpowiadające im formy dwuliniowe[h].
Df. Przestrzeń nazywa się przestrzenią kwadratową.
Df. Przestrzenie i nazywa się izomorficznymi, jeżeli istnieje taki izomorfizm liniowy że
dla wszystkich
Df.Ortogonalną sumą prostą przestrzeni i nazywa się sumę prostą przestrzeni w której zdefiniowano formą kwadratową
Oznaczenie: oznacza -krotną ortogonalną sumę prostą przestrzeni kwadratowej ze sobą.
Df.Wektorem izotropowym względem (bądź ) nazywa się niezerowy wektor dla którego
Innymi słowy: wektor izotropowy to wektor niezerowy, będący rozwiązaniem równania
czyli wektor niezerowy, który jest ortogonalny sam do siebie.
Df. Forma kwadratowa jest w postaci diagonalnej, jeśli zadana jest jako suma kwadratów współrzędnych wektora tj.
Tw. Forma kwadratowa jest w postaci diagonalnej, jeżeli jej reprezentacja macierzowa jest diagonalna, tzn. wszystkie wyrazy macierzy poza główną przekątną są równe zeru.
Twierdzenie Lagrange’a
Dla każdej formy kwadratowej istnieje baza, w której forma ma postać diagonalną
Tw. Wyznacznik formy kwadratowej w postaci diagonalnej wynosi
Konstrukcję bazy ortogonalnej można przeprowadzić w oparciu o własności odpowiadającej jej formy dwuliniowej:
należy rozpocząć od wyboru dowolnego wektora dla którego
trzeba wybrać z podprzestrzeni wektor taki że wektory i są ortogonalne i liniowo niezależne,
należy przejść do i wskazać w niej wektor taki że itd.,
proces kończy się na podprzestrzeni, na której zeruje się tożsamościowo:
jeśli jest to podprzestrzeń zerowa, to wybrane wektory tworzą bazę, w której ma postać diagonalną,
w przeciwnym wypadku bazę diagonalizującą na całej przestrzeni tworzą wybrane wektory oraz dowolna baza otrzymanej podprzestrzeni.
Twierdzenia
Następujące stwierdzenie charakteryzuje formy kwadratowe wprowadzające liczby podwójne. Dla formy kwadratowej określonej na przestrzeni dwuwymiarowej następujące warunki są równoważne:
(a) ma ona postać w pewnej bazie,
(b) jej wyróżnik jest równy
(c) jest ona niezdegenerowana i daje wektory izotropowe.
Df. Formę kwadratową na przestrzeni liniowej nad nazywa się dodatnio określoną (lub dodatnią), jeżeli i ujemnie określoną (lub ujemną), gdy dla wszystkich [l]
Tw. Każda dodatnio określona forma na przestrzeni wymiaru jest równoważna sumie kwadratów. Podobnie ma się rzecz z formami określonymi ujemnie.
Własności te nie zależą od wyboru współrzędnych w przestrzeni.
Uniwersalność
Jeśli jest określona na przestrzeni co najmniej trójwymiarowej nad ciałem skończonym to daje ona wektory izotropowe. W ciele dowolnej charakterystyki pociąga to uniwersalność formy tzn. [m][n]. Choć stwierdzenie o istnieniu wektorów izotropowych w dowolnych przestrzeniach wymiaru 2 nie jest prawdziwe, to prawdą jest, iż dowolna forma na przestrzeni dwuwymiarowej nad ciałem skończonym jest uniwersalna[o].
Twierdzenie
Niech będzie niekwadratem. Dowolna forma kwadratowa na przestrzeni liniowej wymiaru nad ciałem skończonym jest równoważna z dokładnie jedną formą na mianowicie: lub
W szczególności wymiar i wyróżnik wyznaczają formę nad ciałem skończonym w sposób jednoznaczny z dokładnością do równoważności.
Tw. 1 Dla dowolnej formy kwadratowej zachodzi wzór nazywany regułą równoległoboku[p]
Tw. 2 Podobny wzór
znany również jako tożsamość polaryzacyjna, wyraża formę dwuliniową za pomocą formy kwadratowej jednak w inny sposób niż podany w definicji.
Być może oba powyższe wzory mogą posłużyć do zdefiniowania formy kwadratowej? Zagadnieniem tym zajęli się John von Neumann i Pascual Jordan, którzy dowiedli
Tw. 3 (Jordana-von Neumanna)
Założenia:
(1) spełnia tożsamość
(2) jest określona wzorem
Teza:
jest symetryczna, dwuaddytywna oraz
Dwuaddytywność pociąga -dwuliniowość. Stąd z powyższego twierdzenia jest -dwuliniowa, jeśli jest charakterystyki zero lub -dwuliniowa, jeśli jest charakterystyki Oznacza to, że jeśli lub to forma jest kwadratowa. Jeżeli to forma jest kwadratowa, o ile jest skończonego wymiaru (bądź ogólniej: zupełna), przy dodatkowym założeniu, że jest ciągła (co pociąga ciągłość a stąd jej -dwuliniowość).
Przy oznaczeniach oraz i przyjęciu powyższe twierdzenie mówi, że:
Definicja we współrzędnych nie ulega zmianie: forma kwadratowa to jednorodna, kwadratowa funkcja wielomianowa. Podobnie definiuje się pozostałe pojęcia i dowodzi równoważności definicji abstrakcyjnej i z ustaloną bazą. Zasadniczą różnicą jest postać macierzowa: macierz formy kwadratowej jest górnotrójkątna, nie zaś symetryczna; macierz odpowiadającej jej formy dwuliniowej jest z kolei symetryczna z zerami na przekątnej głównej[q]. Niekiedy powyższą definicję stosuje się dla ciał dowolnej charakterystyki[r], jednak przyjęcie jej sprawia, iż forma dwuliniowa stowarzyszona z formą kwadratową wyrażającą się sumą kwadratów nie daje standardowego iloczynu skalarnego, lecz jego dwukrotność.
Jest wtedy i tylko wtedy, gdy wszystkie elementy macierzy spoza przekątnej głównej znikają (równoważnie: wtedy i tylko wtedy, gdy jest diagonalizowalna w pewnej bazie). Gdy charakterystyka nie jest równa 2, wyrazy spoza przekątnej dowolnej formy kwadratowej zerują się w odpowiedniej bazie, jednakże wyrazy spoza przekątnej głównej w są potrzebne w ciele charakterystyki 2, gdy stowarzyszona z nią symetryczna forma dwuliniowa nie jest zerowa. Z definicji dowolna forma kwadratowa (w ciele charakterystyki 2) ma powiązaną symetryczną formę dwuliniową, choć odpowiedniość między formami kwadratowymi a symetrycznymi formami dwuliniowymi nie jest iniektywna, ani surjektywna: różne formy kwadratowe (np. oraz ) mogą mieć tę samą symetryczną formę dwuliniową, a pewne symetryczne formy dwuliniowe (np. ) nie są formami dwuliniowymi jakichkolwiek form kwadratowych. W języku macierzy każda forma kwadratowa w ciele charakterystyki różnej od 2 może być zapisana jako gdzie jest pewną macierzą symetryczną, nie jest to jednak prawda w ciele charakterystyki 2. Forma kwadratowa przedstawiona w baie z wyrazami poza przekątną nie jest reprezentowana przez macierz symetryczną w jakiekolwiek bazie. Jednakże odpowiadająca jej forma dwuliniowa jest zawsze reprezentowana za pomocą macierzy symetrycznej (zob. wyżej). Dlatego nie wolno mylić macierzy formy kwadratowej w ciele charakterystyki 2 z macierzą postaci jej formy dwuliniowej.
Kluczową obserwacją jest to, że symetryczna forma dwuliniowa stowarzyszona z formą kwadratową w ciele charakterystyki 2 jest alternująca:
W ciele charakterystyki innej niż 2 można odzyskać z gdyż ale dla charakterystyki 2 jest Ponieważ dowolna alternująca forma dwuliniowa jest symetryczna w ciele charakterystyki 2, to o odpowiedniości z do w ciele charakterystyki 2 należy myśleć jako o przekształceniu form kwadratowych w alternujące (a nie tylko symetryczna) formy dwuliniowe. Wówczas jest ono surjektywne, ale nadal nigdy nie jest iniektywne, tzn. nie istnieje żaden odpowiednik polaryzacji dla charakterystyki 2, a więc sama wiedza o nie wystarcza do odzyskania informacji o Zatem choć w ciele charakterystyki różnej od 2 pewne pojęcia można wyrazić równie dobrze w języku form kwadratowych bądź symetrycznych form kwadratowych, to w ciele charakterystyki 2 ich wyrażenie w obu tych językach może być niemożliwe.
↑Tradycja zapoczątkowana przez Gaussa każe używać parzystych współczynników przy iloczynach różnych zmiennych, tj. w postaci zamiast w formach binarnych oraz zamiast w formach ternarnych. Obie konwencje są stosowane w literaturze.
↑Niektórzy autorzy terminy „forma” i „funkcjonał” bądź traktują synonimicznie, bądź stosują tylko jeden z nich, np. Komorowski (s. 104) i Więsław (s. 217) używają jedynie określenia „forma kwadratowa”, podając definicję odwzorowania przestrzeni liniowej w ciało skalarów. Inni, np. Gleichgewicht (s. 179–180) czy Newelski (rozdz. 14), odróżniają „funkcjonał” (przekształcenie, funkcja wielomianowa, przedstawienie niezależne od współrzędnych) od „formy” (wyrażenie formalne, wielomian, przedstawienie w bazie). W tym podejściu „forma kwadratowa” jest przedstawieniem „funkcjonału kwadratowego” w ustalonej bazie, co wyjaśniono w definicji; w tym artykule nie stosuje się tej konwencji.
↑Poniższy warunek można przedstawić w dogodniejszej postaci w szczególności jest równoważne co czyni z funkcję addytywną tej przestrzeni liniowej.
↑Indukcja po liczbie wyrazów daje dla dowolnego i wektorów Stąd jeżeli jest bazą tej przestrzeni, to gdzie oraz
↑Jeśli jest postaci wielomianowej jak wyżej, to natychmiast otrzymuje się pierwszą część definicji, dla dowolnego z kolei dla oraz uzyskuje się drugą, przy oznaczeniach oraz W notacji macierzowej wzór ten można wyrazić jako gdzie kropka oznacza standardowy iloczyn skalarnyprzestrzeni współrzędnych zaś oraz
jest macierzą formy dwuliniowej na co czyni zadość definicji formy kwadratowej.
↑Wynika to wprost z zapisania w postaci wielomianowej z macierzą o postaci jak w przypisie wyżej.
↑Niech będzie bazą ortogonalną stowarzyszonej z symetrycznej formy dwuliniowej (istnieje zawsze dla ciał charakterystyki różnej od 2); w bazie tej wyrazy mieszane znikają, a więc jest w postaci diagonalnej; macierz jest wówczas diagonalna, a więc jej wyróżnik jest wymaganej postaci.
↑Niezdegenerowane formy kwadratowe, które nie są ani dodatnio, ani ujemnie określone, nazywa się nieokreślonymi. Rozpatruje się także nierówności nieostre: mówi się wtedy o formach określonych niedodatnio i nieujemnie (bądź półokreślonych dodatnio i ujemnie).
↑Niech będzie wektorem, dla którego ponieważ a (z niezdegenerowania), to z niezdegenerowania formy istnieje dla którego stowarzyszona forma dwuliniowa Wówczas dla dowolnego zachodzi czyli jest to funkcja liniowa zmiennej która przyjmuje wszystkie wartości z
↑Twierdzenie jest fałszywe, gdy jest zdegenerowana, np. na gdzie
↑Po przedstawieniu formy w postaci diagonalnej wystarczy dowieść, iż wielomian postaci przyjmuje wszystkie wartości z dla otóż forma gdzie jest niekwadratem, przyjmuje zero wyłącznie dla co dowodzi różnowartościowości tej funkcji liniowej zmiennej Wynik ten tłumaczy też dlaczego ograniczenie w pierwszym twierdzeniu jest ostre.
↑Wzór ten łatwo wyprowadzić z alternatywnej postaci drugiego wzoru definiującego: wystarczy dodać go do siebie, przy czym jeden z nich z podstawieniem Odjęcie ze wspomnianym podstawieniem daje kolejny.
H. Guściora, M. Sadowski, Repetytorium z algebry liniowej, Państwowe Wydawnictwo Naukowe, Warszawa 1979, s. 123–138.
T. Trajdos, Matematyka dla inżynierów, PWN, Warszawa 1974, s. 73–77.
Więsław, Witold: Algebra geometryczna. Skrypt dla studentów matematyki. Wydawnictwa Uniwersytetu Wrocławskiego, Wrocław 1974.
Komorowski, Jacek: Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk, Państwowe Wydawnictwo Naukowe, Warszawa 1978.
Gleichgewicht, Bolesław: Algebra. Podręcznik dla kierunków nauczycielskich studiów matematycznych, Państwowe Wydawnictwo Naukowe, Warszawa 1983. Wydanie III. ISBN 83-01-03903-5.