Masinõpe: sissejuhatus ruuduliste vigade ja regressioonijoonte tähendusse

Sissejuhatus

Selles artiklis käsitletakse statistilise meetodi keskmist ruutviga ja kirjeldan selle meetodi suhet regressioonijoonega .

Näide koosneb ristküliku telje punktidest. Määratleme matemaatilise funktsiooni, mis annab meile sirgjoone, mis kulgeb kõige paremini Dekartese telje kõigi punktide vahel.

Ja nii õpime nende kahe meetodi vahelist seost ja seda, kuidas nende ühenduse tulemus koos välja näeb.

Üldine selgitus

See on Wikipedia määratlus:

Statistikas mõõdab hindaja (jälgimatu koguse hindamise protseduuri) keskmine ruutviga (MSE) vigade ruutude keskmist - see tähendab keskmist ruutude erinevust hinnanguliste väärtuste ja hinnangulise vahel. MSE on riskifunktsioon, mis vastab ruutvea kadu eeldatavale väärtusele. Asjaolu, et MSE on peaaegu alati rangelt positiivne (ja mitte null), on tingitud juhuslikkusest või seetõttu, et hindaja ei arvesta teavet, mis võiks anda täpsema hinnangu.

Artikli ülesehitus

  • Tunnetage ideed, graafiku visualiseerimist, keskmise ruutvea võrrandit.
  • Matemaatiline osa, mis sisaldab algebralisi manipulatsioone ja kahe muutuja funktsioonide tuletist miinimumi leidmiseks. See jaotis on mõeldud neile, kes soovivad mõista, kuidas me hiljem matemaatilisi valemeid saame, võite selle vahele jätta, kui see teid ei huvita.
  • Saadud matemaatiliste valemite selgitus ja iga muutuja roll valemis.
  • Näited

Tundke ideed

Oletame, et meil on seitse punkti ja meie eesmärk on leida joon, mis minimeerib nende erinevate punktide ruutude vahemaad.

Proovime sellest aru saada.

Võtan näite ja joon punktide vahele joone. Muidugi pole minu joonistus parim, kuid see on mõeldud ainult tutvustamiseks.

Võiksite endalt küsida, mis see graafik on?

  • lilla dots on graafiku punkti. Igal punktil on x-koordinaat ja y-koordinaat.
  • Sinine joon on meie ennustus joon. See on joon, mis läbib kõik punktid ja sobib neile kõige paremini. See rida sisaldab ennustatud punkte.
  • Punane joon vahel iga lilla punkti ja ennustus line on vigu. Iga viga on kaugus punktist ennustatud punktini.

Peaksite seda võrrandit oma kooliajast meeles pidama, y = Mx + B , kus M on sirge kalle ja B on sirge y-lõikepunkt.

Me tahame leida M (kalle) ja B (y-lõikepunkt), mis minimeerivad ruutvea!

Määratleme matemaatilise võrrandi, mis annab meile kõigi punktide keskmise ruutvea.

Analüüsime, mida see võrrand tegelikult tähendab.

  • Matemaatikas nimetatakse imelikuks E tunduvat tegelast summeerimiseks (kreeka sigma). See on arvude järjestuse summa alates i = 1 kuni n. Kujutame seda ette nagu punktide massiivi, kus läbime kõik punktid, esimesest (i = 1) kuni viimaseni (i = n).
  • Iga punkti jaoks võtame punkti y-koordinaadi ja y'-koordinaadi. Y-koordinaat on meie lilla punkt. Y-punkt asub meie loodud joonel. Lahutame y-koordinaadi väärtusest y-koordinaadi väärtuse ja arvutame tulemuse ruudu.
  • Kolmas osa on kõigi (y-y ') 2 väärtuste summa jagamine n-ga, mis annab keskmise.

Meie eesmärk on selle keskmise minimeerimine, mis annab meile parima joone, mis läbib kõik punktid.

Mõistest matemaatiliste võrranditeni

See osa on mõeldud inimestele, kes soovivad mõista, kuidas me matemaatiliste võrranditeni jõudsime . Soovi korral saate hüpata järgmise osa juurde.

Nagu teate, on sirgvõrrand y = mx + b, kus m on kalle ja b on y-lõikepunkt.

Võtame graafiku iga punkti ja teeme arvutuse (y-y ') ².

Aga mis on y 'ja kuidas me seda arvutame? Meil pole seda andmete osana.

Kuid me teame, et y 'arvutamiseks peame kasutama oma sirgvõrrandit y = mx + b ja panema x võrrandisse.

Siit saame järgmise võrrandi:

Kirjutame selle väljendi selle lihtsustamiseks ümber.

Alustame kõigi võrrandi sulgude avamisest. Värvisin võrrandite erinevuse, et seda paremini mõista.

Rakendame nüüd veel ühte manipuleerimist. Võtame iga osa ja paneme kokku. Võtame kõik y ja (-2ymx) jne, ja paneme need kõik kõrvuti.

Siinkohal hakkame segaduses olema, seega võtame kõigi ruutude y, xy, x, x² väärtuste keskmise.

Määratleme igaühe jaoks uue märgi, mis tähistab kõigi ruutude väärtuste keskmist.

Vaatame näite, võtame kõik y väärtused ja jagame need n-ga, kuna see on keskmine, ja nimetame seda y (HeadLine).

Kui korrutame võrrandi mõlemad pooled n-ga, saame:

Mis viib meid järgmise võrrandini:

Kui me vaatame, mida me saime, näeme, et meil on 3D-pind. See näeb välja nagu klaas, mis tõuseb järsult ülespoole.

Soovime leida funktsiooni minimeerivad M ja B. Teeme osalise tuletise M suhtes ja osalise tuletise B suhtes.

Kuna otsime miinimumpunkti, võtame osalised tuletised ja võrdleme 0-ga.

Võtame kaks saadud võrrandit, eraldades muutuja b mõlemast ja lahutades seejärel ülemise võrrandi alumisest võrrandist.

Lahutame esimese võrrandi teisest võrrandist

Vabastame võrrandis nimetajatest.

Ja seal me läheme, see on võrrandi leidmiseks M, võtame selle ja kirjutame üles B võrrandi.

Kalde ja y-lõikepunktide võrrandid

Pakume matemaatilisi võrrandeid, mis aitavad meil leida nõutavat kallet ja y-lõikepunkti.

Nii et ilmselt mõtlete endamisi, mis pagan need imelikud võrrandid on?

Neid on tegelikult lihtne mõista, nii et räägime neist natuke.

Nüüd, kui oleme oma võrranditest aru saanud, on aeg kõik asjad kokku saada ja mõned näited näidata.

Näited

Suur aitäh Khani akadeemiale näidete eest.

Näide 1

Võtame 3 punkti (1,2), (2,1), (4,3).

Leiame võrrandi y = mx + b korral M ja B.

Kui oleme arvutanud oma M-võrrandi ja B-võrrandi asjakohased osad, paneme need väärtused võrranditesse ja saame kalle ja y-lõikepunkti.

Võtame need tulemused ja seame need sirgvõrrandi y = mx + b sisse.

Nüüd tõmbame joone ja näeme, kuidas joon läbib jooni nii, et see minimeerib ruutude vahemaad.

Näide 2

Võtame 4 punkti, (-2, -3), (-1, -1), (1,2), (4,3).

Leiame võrrandi y = mx + b korral M ja B.

Sarnaselt varasemale, asetame need väärtused oma võrranditesse, et leida M ja B.

Võtame need tulemused ja seame need joone võrrandi y = mx + b sisse.

Nüüd tõmbame joone ja näeme, kuidas joon läbib jooni nii, et see minimeerib ruutude vahemaad.

Kokkuvõtteks

Nagu näete, on kogu idee lihtne. Peame lihtsalt aru saama peamistest osadest ja sellest, kuidas me nendega töötame.

Valemitega saate sirgjoone leida teiselt graafikult ja teha lihtne arvutus ning saada kalle ja y-lõikepunkti tulemused.

See on kõik, lihtne? ?

Iga kommentaar ja kogu tagasiside on teretulnud - kui see on vajalik, parandan artikli.

Võtke julgelt ühendust otse LinkedInis - klõpsake siin.