Metoden til mindst firkanter er en af de vigtigste applikationer i tilnærmelsen af funktioner. Ideen er at finde en kurve, således at denne funktion, når man får et sæt bestilte par, bedst tilnærmer dataene. Funktionen kan være en linje, en kvadratisk kurve, en kubik osv.
Idéen om metoden består i at minimere summen af kvadrater af forskellene i ordinaten (Y-komponenten), mellem punkterne genereret af den valgte funktion og de punkter, der hører til datasættet.
Mindst kvadrater metode
Før vi giver metoden, skal vi først være klar over, hvad ”bedre tilgang” betyder. Antag, at vi leder efter en linje y = b + mx, der er den, der bedst repræsenterer et sæt n punkter, nemlig {(x1, y1), (x2, y2)…, (xn, yn)}.
Som vist i det forrige figur, hvis variablerne x og y var relateret til linjen y = b + mx, ville den tilsvarende værdi af y være b + mx1 for x = x1. Denne værdi er dog forskellig fra den sande værdi af y, der er y = y1.
Husk, at i flyet er afstanden mellem to punkter angivet med følgende formel:
Med dette i tankerne for at bestemme, hvordan man vælger linjen y = b + mx, der bedst tilnærmer de givne data, forekommer det logisk at bruge som kriterium valget af den linje, der minimerer summen af kvadraterne for afstandene mellem punkterne og lige.
Da afstanden mellem punkterne (x1, y1) og (x1, b + mx1) er y1- (b + mx1), reduceres vores problem til at finde tallene m og b således, at følgende sum er minimal:
Linjen, der opfylder denne betingelse, er kendt som «tilnærmelse af linien med de mindste kvadrater til punkterne (x1, y1), (x2, y2),…, (xn, yn)».
Når problemet er opnået, gjenstår det kun at vælge en metode til at finde den mindst kvadrater tilnærmelse. Hvis punkterne (x1, y1), (x2, y2),…, (xn, yn) alle er på linjen y = mx + b, ville vi have, at de er kollinære y:
I dette udtryk:
Endelig, hvis punkterne ikke er kollinære, så kan y-Au = 0 og problemet oversættes til at finde en vektor u, således at den euklidiske norm er minimal.
At finde minimeringsvektoren u er ikke så svært som du måske tror. Eftersom A er et nx2 matrix, og u er en 2 × 1 matrix, har vi at vektoren Au er en vektor i R n og hører til billedet af A, som er et underrum af R n med en dimension ikke er større end to.
Vi antager, at n = 3 for at vise, hvilken procedure vi skal følge. Hvis n = 3, vil billedet af A være et plan eller en linje gennem oprindelsen.
Lad v være den minimerende vektor. I figuren observerer vi, at y-Au er minimeret, når det er vinkelret på billedet af A. Det vil sige, hvis v er den minimerende vektor, sker det så, at:
Derefter kan vi udtrykke ovenstående på denne måde:
Dette kan kun ske, hvis:
Endelig har vi løst for v:
Det er muligt at gøre dette, da A t A er inverterbar, så længe de n punkter, der er angivet som data ikke er kollinære.
Hvis vi i stedet for at lede efter en linje ønskede at finde en parabola (hvis udtryk ville være af formen y = a + bx + cx 2), der ville være en bedre tilnærmelse til n datapunkter, ville proceduren være som beskrevet nedenfor.
Hvis de n datapunkter var i denne parabola, ville vi have:
Derefter:
Tilsvarende kan vi skrive y = Au. Hvis alle punkter ikke er i parabolen, har vi, at y-Au er forskellig fra nul for enhver vektor u, og vores problem er igen: find en vektor u i R3, så dens norm - y-Au-- er så lille som muligt.
Ved at gentage den foregående procedure kan vi nå frem til, at den søgte vektor er:
Løst øvelser
Øvelse 1
Find den linje, der bedst passer til punkterne (1,4), (-2,5), (3, -1) og (4,1).
Løsning
Vi skal:
Derefter:
Derfor konkluderer vi, at den linje, der bedst passer til point er givet af:
Øvelse 2
Antag, at et objekt falder fra en højde på 200 m. Når det falder, er følgende skridt taget:
Vi ved, at højden af nævnte genstand, efter en tid t er gået, er givet af:
Hvis vi ønsker at opnå værdien af g, kan vi finde en parabola, der er en bedre tilnærmelse til de fem punkter, der er angivet i tabellen, og derfor ville vi have, at koefficienten, der ledsager t 2, vil være en rimelig tilnærmelse til (-1/2) g, hvis målinger er nøjagtige.
Vi skal:
Og senere:
Så datapunkterne passer sammen med følgende kvadratiske udtryk:
Så du skal:
Dette er en værdi, der er rimeligt tæt på at korrigere, som er g = 9,81 m / s 2. For at opnå en mere nøjagtig tilnærmelse af g, ville det være nødvendigt at starte fra mere præcise observationer.
Hvad er det for?
I de problemer, der opstår i natur- eller samfundsvidenskab, er det praktisk at skrive de forhold, der findes mellem forskellige variabler ved hjælp af et eller andet matematisk udtryk.
For eksempel kan vi inden for økonomi relatere omkostninger (C), indkomst (I) og overskud (U) ved hjælp af en simpel formel:
I fysik kan vi fortælle accelerationen forårsaget af tyngdekraften, den tid, et objekt er faldet, og objektets højde ved lov:
I det foregående udtryk s o er den første højde af objektet og v o er dens starthastighed.
Det er dog ikke let at finde formler som disse; Det er normalt op til den professionelle, der er på vagt, at arbejde med en masse data og gentagne gange udføre adskillige eksperimenter (for at verificere, at de opnåede resultater er konstante) for at finde sammenhænge mellem de forskellige data.
En almindelig måde at opnå dette på er at repræsentere de data, der opnås i et plan som punkter, og se efter en kontinuerlig funktion, der optimalt tilnærmer disse punkter.
En af måderne til at finde den funktion, der "bedst tilnærmer" de givne data, er ved hjælp af metoden med mindst firkanter.
Som vi også så i øvelsen, kan vi takket være denne metode få temmelig tætte tilnærmelser til fysiske konstanter.
Referencer
- Charles W Curtis Lineær algebra. Springer-Velarg
- Kai Lai Chung. Elementær praktisk teori med stokastiske processer. Springer-Verlag New York Inc
- Richar L Burden & J.Douglas Faires. Numerisk analyse (7ed). Thompson Learning.
- Stanley I. Grossman. Anvendelser af lineær algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO
- Stanley I. Grossman. Lineær algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO