Statistiniai metodai. Tikimybinių ir statistinių neapibrėžčių aprašymo metodų pagrindai Bendrieji loginiai mokslinio tyrimo metodai

3.5.1. Tikimybinio-statistinio tyrimo metodas.

Daugeliu atvejų reikia tirti ne tik deterministinius, bet ir atsitiktinius tikimybinius (statistinius) procesus. Šie procesai nagrinėjami remiantis tikimybių teorija.

Atsitiktinių dydžių x rinkinys sudaro pirminę matematinę medžiagą. Aibė suprantama kaip vienarūšių įvykių visuma. Aibė, kurioje yra patys įvairiausi masinio reiškinio variantai, vadinama bendrąja populiacija arba didelis pavyzdys N. Dažniausiai tiriama tik dalis populiacijos, vadinama pasirenkama populiacija arba nedidelė imtis.

Tikimybė P(x)įvykius X vadinamas bylų skaičiaus santykiu N(x), kurios lemia įvykį X, į bendrą galimų atvejų skaičių N:

P(x)=N(x)/N.

Tikimybių teorija nagrinėja teorinius atsitiktinių dydžių skirstinius ir jų charakteristikas.

Matematinė statistika nagrinėja empirinių įvykių apdorojimo ir analizės būdus.

Šie du susiję mokslai sudaro vieną matematinę masinių atsitiktinių procesų teoriją, plačiai naudojamą moksliniams tyrimams analizuoti.

Tikimybių ir matematinės statistikos metodai labai dažnai naudojami patikimumo, išgyvenamumo ir saugos teorijoje, kuri plačiai naudojama įvairiose mokslo ir technikos šakose.

3.5.2. Statistinio modeliavimo arba statistinio testavimo metodas (Monte Karlo metodas).

Šis metodas yra skaitinis sudėtingų problemų sprendimo metodas ir pagrįstas atsitiktinių skaičių, imituojančių tikimybinius procesus, naudojimu. Šio metodo sprendimo rezultatai leidžia empiriškai nustatyti tiriamų procesų priklausomybes.

Problemų sprendimas naudojant Monte Karlo metodą yra efektyvus tik naudojant didelės spartos kompiuterius. Norėdami išspręsti problemas Monte Karlo metodu, turite turėti statistinę eilutę, žinoti jos pasiskirstymo dėsnį, vidutinę vertę ir matematinį lūkestį. t(x), standartinis nuokrypis.

Naudodami šį metodą galite gauti savavališkai nurodytą sprendimo tikslumą, t.y.

-> t(x)

3.5.3. Sistemos analizės metodas.

Sistemos analizė suprantama kaip sudėtingų sistemų, kurios yra sudėtingas sąveikaujančių elementų rinkinys, tyrimo metodų ir metodų rinkinys. Sistemos elementų sąveikai būdingi tiesioginiai ir grįžtamojo ryšio ryšiai.

Sistemos analizės esmė yra nustatyti šiuos ryšius ir nustatyti jų įtaką visos sistemos elgsenai kaip visumai. Išsamiausią ir nuodugniausią sistemos analizę galima atlikti naudojant kibernetikos metodus, kurie yra mokslas apie sudėtingas dinamines sistemas, galinčias suvokti, saugoti ir apdoroti informaciją optimizavimo ir valdymo tikslais.

Sistemos analizė susideda iš keturių etapų.

Pirmasis etapas – problemos išdėstymas: nustatomas tyrimo objektas, tikslai ir uždaviniai bei objekto tyrimo ir jo valdymo kriterijai.

Antrojo etapo metu nustatomos tiriamos sistemos ribos ir nustatoma jos struktūra. Visi su tikslu susiję objektai ir procesai skirstomi į dvi klases – pačią tiriamą sistemą ir išorinę aplinką. Išskirti uždaryta Ir atviras sistemos. Tiriant uždaras sistemas, nepaisoma išorinės aplinkos įtakos jų elgesiui. Tada nustatomi atskiri sistemos komponentai – jos elementai, nustatoma jų sąveika su išorine aplinka.

Trečiasis sistemos analizės etapas – tiriamos sistemos matematinio modelio sudarymas. Pirma, sistema parametrizuojama, naudojant tam tikrus parametrus aprašomi pagrindiniai sistemos elementai ir elementarus poveikis jai. Kartu išskiriami parametrai, apibūdinantys nuolatinius ir diskrečius, deterministinius ir tikimybinius procesus. Priklausomai nuo procesų charakteristikų, naudojamas vienoks ar kitoks matematinis aparatas.

Trečiojo sistemos analizės etapo rezultate susidaro pilni matematiniai sistemos modeliai, aprašomi formalia, pavyzdžiui, algoritmine kalba.

Ketvirtajame etape analizuojamas gautas matematinis modelis, randamos ekstremalios jo sąlygos, siekiant optimizuoti procesus ir valdymo sistemas bei formuluojamos išvados. Optimizavimas vertinamas pagal optimizavimo kriterijų, kuris šiuo atveju užima kraštutines reikšmes (minimalus, maksimalus, minimumas).

Paprastai pasirenkamas vienas kriterijus, o kitiems nustatomos didžiausios leistinos vertės. Kartais naudojami mišrūs kriterijai, kurie priklauso nuo pirminių parametrų.

Remiantis pasirinktu optimizavimo kriterijumi, sudaroma optimizavimo kriterijaus priklausomybė nuo tiriamo objekto (proceso) modelio parametrų.

Yra žinomi įvairūs matematiniai tiriamų modelių optimizavimo metodai: tiesinio, netiesinio ar dinaminio programavimo metodai; tikimybiniai-statistiniai metodai, pagrįsti eilių teorija; žaidimų teorija, kuri procesų vystymąsi laiko atsitiktinėmis situacijomis.

Žinių savikontrolės klausimai

Teorinio tyrimo metodika.

Pagrindinės mokslinių tyrimų teorinės raidos stadijos skyriai.

Modelių tipai ir tiriamojo objekto modeliavimo tipai.

Analitiniai tyrimo metodai.

Analitiniai tyrimo metodai naudojant eksperimentą.

Tikimybinis-analitinis tyrimo metodas.

Statinio modeliavimo metodai (Monte Karlo metodas).

Sistemos analizės metodas.

Kaip naudojama tikimybių teorija ir matematinė statistika?Šios disciplinos yra tikimybinių ir statistinių sprendimų priėmimo metodų pagrindas. Norint panaudoti jų matematinį aparatą, sprendimų priėmimo problemas būtina išreikšti tikimybiniais-statistiniais modeliais. Konkretaus tikimybinio-statistinio sprendimų priėmimo metodo taikymas susideda iš trijų etapų:

Perėjimas nuo ekonominės, vadybinės, technologinės realybės prie abstrakčios matematinės ir statistinės schemos, t.y. tikimybinio valdymo sistemos modelio konstravimas, technologinis procesas, sprendimų priėmimo procedūra, ypač remiantis statistinės kontrolės rezultatais ir kt.

Skaičiavimų ir išvadų darymas grynai matematinėmis priemonėmis tikimybinio modelio rėmuose;

Matematinių ir statistinių išvadų, susijusių su realia situacija, interpretavimas ir tinkamo sprendimo priėmimas (pavyzdžiui, dėl gaminio kokybės atitikties ar neatitikimo nustatytiems reikalavimams, būtinybės koreguoti technologinį procesą ir pan.), visų pirma, išvados (dėl brokuotų gaminio vienetų proporcijos partijoje, dėl konkrečios technologinio proceso valdomų parametrų pasiskirstymo dėsnių formos ir kt.).

Matematinė statistika naudoja tikimybių teorijos sąvokas, metodus ir rezultatus. Panagrinėkime pagrindinius sprendimų priėmimo ekonominėse, vadybinėse, technologinėse ir kitose situacijose tikimybinių modelių konstravimo klausimus. Norint aktyviai ir teisingai naudoti norminius, techninius ir instrukcijų dokumentus apie tikimybinius ir statistinius sprendimų priėmimo metodus, reikalingos išankstinės žinios. Taigi būtina žinoti, kokiomis sąlygomis konkretus dokumentas turi būti naudojamas, kokią pirminę informaciją būtina turėti jo parinkimui ir pritaikymui, kokius sprendimus priimti remiantis duomenų tvarkymo rezultatais ir pan.

Taikymo pavyzdžiai tikimybių teorija ir matematinė statistika. Panagrinėkime kelis pavyzdžius, kai tikimybiniai-statistiniai modeliai yra geras valdymo, gamybos, ekonomikos, šalies ekonomikos problemų sprendimo įrankis. Taigi, pavyzdžiui, A. N. Tolstojaus romane „Pasivaikščiojimas per kankinimus“ (1 tomas) sakoma: „Cechas gamina dvidešimt tris procentus šiukšlių, tu laikykis šios figūros“, – Ivanui Iljičiui sakė Strukovas.

Kyla klausimas, kaip suprasti šiuos žodžius gamyklos vadovų pokalbyje, nes vienas gamybos vienetas negali būti 23% brokuotas. Jis gali būti geras arba su defektais. Strukovas tikriausiai turėjo omenyje, kad didelės apimties partijoje yra apie 23% sugedusių produkcijos vienetų. Tada kyla klausimas, ką reiškia „apytiksliai“? Tegul 30 iš 100 patikrintų produkcijos vienetų pasirodo brokuoti, ar iš 1000 - 300, ar iš 100 000 - 30 000 ir t.t., ar reikia apkaltinti Strukovą melavimu?

Arba kitas pavyzdys. Moneta naudojama kaip partija turi būti „simetriška“, t.y. jį metant, vidutiniškai pusei atvejų turėtų atsirasti herbas, puse atvejų – maiša (uodegos, skaičius). Bet ką reiškia „vidutiniškai“? Jei atliekate daug 10 metimų serijų kiekvienoje serijoje, tada dažnai susidursite su serijomis, kuriose moneta 4 kartus atsiduria kaip herbas. Simetriškoje monetoje tai įvyks 20,5 % paleidimų. O jei po 100 000 metimų yra 40 000 herbų, ar monetą galima laikyti simetriška? Sprendimų priėmimo procedūra yra pagrįsta tikimybių teorija ir matematine statistika.

Aptariamas pavyzdys gali atrodyti nepakankamai rimtas. Tačiau taip nėra. Brėžiniai plačiai naudojami organizuojant pramoninius techninius ir ekonominius eksperimentus, pavyzdžiui, apdorojant guolių kokybės rodiklio (trinties momento) matavimo rezultatus, priklausomai nuo įvairių technologinių faktorių (konservavimo aplinkos įtaka, guolių paruošimo prieš matavimą metodai). , guolių apkrovų įtaka matavimo procese ir kt.). Tarkime, reikia palyginti guolių kokybę priklausomai nuo jų laikymo skirtingose ​​konservavimo alyvose rezultatų, t.y. kompoziciniuose aliejuose A Ir IN. Planuojant tokį eksperimentą, kyla klausimas, kokius guolius reikėtų dėti į kompozicijos alyvą A, o kurios – aliejaus sudėtyje IN, bet taip, kad būtų išvengta subjektyvumo ir būtų užtikrintas priimto sprendimo objektyvumas.

Atsakymą į šį klausimą galima gauti burtų keliu. Panašus pavyzdys gali būti pateiktas su bet kurio gaminio kokybės kontrole. Norint nuspręsti, ar kontroliuojama produktų partija atitinka ar neatitinka nustatytų reikalavimų, iš jos parenkamas pavyzdys. Remiantis mėginio kontrolės rezultatais, daroma išvada apie visą partiją. Šiuo atveju formuojant imtį labai svarbu vengti subjektyvumo, tai yra būtina, kad kiekvienas kontroliuojamos partijos gaminio vienetas turėtų vienodą tikimybę būti atrinktam į mėginį. Gamybos sąlygomis produkcijos vienetų atranka imčiai dažniausiai vykdoma ne burtų keliu, o specialiomis atsitiktinių skaičių lentelėmis arba naudojant kompiuterinius atsitiktinių skaičių jutiklius.

Panašios palyginimo objektyvumo užtikrinimo problemos iškyla lyginant įvairias gamybos organizavimo, darbo apmokėjimo schemas, konkursų ir konkursų metu, atrenkant kandidatus į laisvas pareigas ir kt. Visur reikia burtų ar panašių procedūrų. Paaiškinkime stipriausios ir antros stiprybės komandų nustatymo pavyzdžiu organizuojant turnyrą pagal olimpinę sistemą (pralaimėtojas pašalinamas). Tegul stipresnė komanda visada nugali silpnesnę. Aišku, kad čempione tikrai taps stipriausia komanda. Antra pagal stiprumą komanda į finalą pateks tada ir tik tuomet, jei iki finalo nežais su būsimu čempionu. Jeigu toks žaidimas bus suplanuotas, antra pagal stiprumą komanda į finalą nepateks. Turnyro planuotojas gali anksčiau laiko „išmušti“ iš turnyro antrąją pagal stiprumą komandą, pirmame susitikime supriešdamas ją su lydere, arba suteikti jai antrąją vietą, užtikrindamas susitikimus su silpnesnėmis komandomis iki pat galutinis. Siekiant išvengti subjektyvumo, atliekamos lygiosios. 8 komandų turnyre tikimybė, kad dvi geriausios komandos susitiks finale, yra 4/7. Atitinkamai, su tikimybe 3/7, antra pagal stiprumą komanda turnyrą paliks anksčiau laiko.

Bet koks gaminio vienetų matavimas (naudojant suportą, mikrometrą, ampermetrą ir kt.) turi klaidų. Norint išsiaiškinti, ar nėra sisteminių klaidų, reikia pakartotinai išmatuoti gaminio vienetą, kurio charakteristikos yra žinomos (pavyzdžiui, standartinio mėginio). Reikėtų prisiminti, kad be sisteminės klaidos yra ir atsitiktinių klaidų.

Todėl kyla klausimas, kaip iš matavimo rezultatų sužinoti, ar nėra sisteminės paklaidos. Jei tik pažymėsime, ar kito matavimo metu gauta paklaida yra teigiama, ar neigiama, šią užduotį galima sumažinti iki ankstesnės. Iš tiesų, palyginkime matavimą su monetos metimu, teigiamą paklaidą su herbo praradimu, neigiamą paklaidą su tinkleliu (nulinės paklaidos su pakankamu mastelio padalijimų skaičiumi beveik niekada nebūna). Tada tikrinimas, ar nėra sisteminės klaidos, prilygsta monetos simetrijos patikrinimui.

Šių svarstymų tikslas – sisteminės klaidos nebuvimo tikrinimo problemą sumažinti iki monetos simetrijos patikrinimo. Aukščiau pateiktas samprotavimas veda prie vadinamojo „ženklo kriterijaus“ matematinėje statistikoje.

Technologinių procesų statistiniame reglamentavime, remiantis matematinės statistikos metodais, rengiamos statistinių procesų valdymo taisyklės ir planai, kuriais siekiama laiku aptikti technologinių procesų problemas ir imtis priemonių joms koreguoti bei užkirsti kelią gaminių, kurie nėra atitinka nustatytus reikalavimus. Šiomis priemonėmis siekiama sumažinti gamybos sąnaudas ir nuostolius dėl nekokybiškų vienetų tiekimo. Atliekant statistinę priėmimo kontrolę, remiantis matematinės statistikos metodais, analizuojant gaminių partijų mėginius, sudaromi kokybės kontrolės planai. Sunkumas slypi gebėjime teisingai sukurti tikimybinius-statistinius sprendimų priėmimo modelius, kuriais remiantis būtų galima atsakyti į aukščiau pateiktus klausimus. Matematinės statistikos srityje tam buvo sukurti tikimybiniai modeliai ir hipotezių tikrinimo metodai, ypač hipotezės, kad sugedusių produkcijos vienetų dalis yra lygi tam tikram skaičiui. R 0 , Pavyzdžiui, R 0 = 0,23 (prisiminkime Strukovo žodžius iš A. N. Tolstojaus romano).

Vertinimo užduotys. Daugelyje vadybinių, gamybinių, ekonominių ir šalies ekonominių situacijų iškyla kitokio pobūdžio problemos – tikimybių skirstinių charakteristikų ir parametrų vertinimo problemos.

Pažiūrėkime į pavyzdį. Leiskite partijai N elektros lempos Iš šios partijos pavyzdys n elektros lempos Kyla nemažai natūralių klausimų. Kaip pagal pavyzdinių elementų bandymų rezultatus nustatyti vidutinį elektros lempų tarnavimo laiką ir kokiu tikslumu galima įvertinti šią charakteristiką? Kaip pasikeis tikslumas, jei paimsime didesnį mėginį? Kokiu valandų skaičiumi T galima garantuoti, kad bent 90% elektros lempų tarnaus T ir daugiau valandų?

Tarkime, kad tikrinant imties dydį n elektros lempos pasirodė sugedusios X elektros lempos Tada iškyla tokie klausimai. Kokias ribas galima nurodyti skaičiui? D sugedusios lemputės partijoje, pagal defektų lygį D/ N ir taip toliau.?

Arba, statistiškai analizuojant technologinių procesų tikslumą ir stabilumą, reikia įvertinti tokius kokybės rodiklius kaip vidutinė kontroliuojamo parametro reikšmė ir jo sklaidos laipsnis nagrinėjamame procese. Pagal tikimybių teoriją, kaip vidutinę atsitiktinio dydžio reikšmę, patartina naudoti jos matematinį lūkestį, o kaip statistinę sklaidos charakteristiką – dispersiją, standartinį nuokrypį arba variacijos koeficientą. Tai kelia klausimą: kaip įvertinti šias statistines charakteristikas pagal imties duomenis ir kokiu tikslumu tai galima padaryti? Galima pateikti daug panašių pavyzdžių. Čia buvo svarbu parodyti, kaip gamybos valdyme gali būti panaudota tikimybių teorija ir matematinė statistika priimant sprendimus statistinio gaminių kokybės valdymo srityje.

Kas yra „matematinė statistika“? Matematinė statistika suprantama kaip „matematikos šaka, skirta matematiniams statistinių duomenų rinkimo, sisteminimo, apdorojimo ir interpretavimo būdams, taip pat jų panaudojimui mokslinėms ar praktinėms išvadoms. Matematinės statistikos taisyklės ir procedūros yra pagrįstos tikimybių teorija, kuri leidžia pagal turimą statistinę medžiagą įvertinti kiekvienoje užduotyje gautų išvadų tikslumą ir patikimumą.“ Šiuo atveju statistiniai duomenys reiškia informaciją apie objektų skaičių bet kurioje daugiau ar mažiau plačioje kolekcijoje, turinčių tam tikras savybes.

Pagal sprendžiamų uždavinių tipą matematinė statistika paprastai skirstoma į tris dalis: duomenų aprašymas, įvertinimas ir hipotezių tikrinimas.

Atsižvelgiant į apdorojamų statistinių duomenų tipą, matematinė statistika skirstoma į keturias sritis:

Vienamatė statistika (atsitiktinių dydžių statistika), kurioje stebėjimo rezultatas apibūdinamas realiuoju skaičiumi;

Daugiamatė statistinė analizė, kai objekto stebėjimo rezultatas apibūdinamas keliais skaičiais (vektoriu);

Atsitiktinių procesų ir laiko eilučių statistika, kur stebėjimo rezultatas yra funkcija;

Neskaitinio pobūdžio objektų statistika, kai stebėjimo rezultatas yra neskaitinio pobūdžio, pavyzdžiui, tai yra aibė (geometrinė figūra), tvarka arba gautas matavimo rezultatas. pagal kokybinį kriterijų.

Istoriškai pirmosios pasirodė kai kurios neskaitinio pobūdžio objektų statistikos sritys (ypač defektų proporcijos įvertinimo ir hipotezių apie tai tikrinimo problemos) ir vienmatė statistika. Matematinis aparatas jiems paprastesnis, todėl jų pavyzdžiu dažniausiai parodomos pagrindinės matematinės statistikos idėjos.

Tik tie duomenų tvarkymo būdai, t.y. matematinė statistika yra pagrįsta įrodymais, kuri remiasi tikimybiniais atitinkamų realių reiškinių ir procesų modeliais. Kalbame apie vartotojų elgesio modelius, rizikų atsiradimą, technologinės įrangos funkcionavimą, eksperimentinių rezultatų gavimą, ligos eigą ir kt. Tikimybinis realaus reiškinio modelis turėtų būti laikomas sukonstruotu, jei nagrinėjami dydžiai ir ryšiai tarp jų išreikšti tikimybių teorija. Tikimybinio tikrovės modelio atitikimas, t.y. jos adekvatumas yra pagrįstas, ypač naudojant statistinius hipotezių tikrinimo metodus.

Netikimybiniai duomenų apdorojimo metodai yra tiriamieji, jie gali būti naudojami tik atliekant preliminarią duomenų analizę, nes jie neleidžia įvertinti išvadų, gautų remiantis ribota statistine medžiaga, tikslumo ir patikimumo.

Tikimybiniai ir statistiniai metodai taikomi visur, kur įmanoma sukurti ir pagrįsti tikimybinį reiškinio ar proceso modelį. Jų naudojimas yra privalomas, kai iš imties duomenų padarytos išvados perduodamos visai populiacijai (pavyzdžiui, iš imties į visą produktų partiją).

Konkrečiose taikymo srityse naudojami tiek tikimybiniai, tiek statistiniai bendrojo taikymo ir specifiniai metodai. Pavyzdžiui, gamybos valdymo skyriuje, skirtoje statistiniams gaminių kokybės valdymo metodams, naudojama taikomoji matematinė statistika (įskaitant ir eksperimentų planavimą). Jos metodais atliekama statistinė technologinių procesų tikslumo ir stabilumo analizė bei statistinis kokybės vertinimas. Konkretūs metodai apima gaminių kokybės statistinės priėmimo kontrolės, technologinių procesų statistinio reguliavimo, patikimumo vertinimo ir kontrolės metodus ir kt.

Plačiai naudojamos taikomos tikimybinės ir statistinės disciplinos, tokios kaip patikimumo teorija ir eilių teorija. Pirmosios iš jų turinys aiškus iš pavadinimo, antrasis susijęs su tokių sistemų, kaip telefono stotis, kuri priima skambučius atsitiktiniu laiku, studijomis – abonentų, rinkančių numerius savo telefonų aparatuose, reikalavimus. Šių reikalavimų aptarnavimo trukmė, t.y. pokalbių trukmė taip pat modeliuojama atsitiktiniais dydžiais. Didelį indėlį plėtojant šias disciplinas įnešė SSRS mokslų akademijos narys korespondentas A.Ya. Khinchinas (1894-1959), Ukrainos SSR mokslų akademijos akademikas B.V.Gnedenko (1912-1995) ir kiti šalies mokslininkai.

Trumpai apie matematinės statistikos istoriją. Matematinė statistika kaip mokslas prasideda žymaus vokiečių matematiko Carlo Friedricho Gausso (1777-1855) darbais, kurie, remdamiesi tikimybių teorija, ištyrė ir pagrindė 1795 metais jo sukurtą mažiausių kvadratų metodą, naudotą astronominiams duomenims apdoroti. siekiant išsiaiškinti mažos Cereros planetos orbitą). Jo vardu dažnai pavadintas vienas populiariausių tikimybių skirstinių – normalusis, o atsitiktinių procesų teorijoje pagrindinis tyrimo objektas yra Gauso procesai.

pabaigoje – XIX a. – XX amžiaus pradžia Didelį indėlį į matematinę statistiką įnešė anglų tyrinėtojai, pirmiausia K. Pearsonas (1857-1936) ir R. A. Fisheris (1890-1962). Visų pirma Pearsonas sukūrė chi kvadrato testą statistinėms hipotezėms tikrinti, o Fisheris sukūrė dispersijos analizę, eksperimentinio planavimo teoriją ir didžiausios tikimybės metodą parametrams įvertinti.

XX amžiaus 30-aisiais. Lenkas Jerzy Neumannas (1894-1977) ir anglas E. Pearsonas sukūrė bendrąją statistinių hipotezių tikrinimo teoriją, o sovietų matematikai akademikas A.N. Kolmogorovas (1903-1987) ir SSRS mokslų akademijos narys korespondentas N.V.Smirnovas (1900-1966) padėjo neparametrinės statistikos pagrindus. XX amžiaus ketvirtajame dešimtmetyje. Rumunas A. Waldas (1902-1950) sukūrė nuoseklios statistinės analizės teoriją.

Šiuo metu matematinė statistika sparčiai vystosi. Taigi per pastaruosius 40 metų galima išskirti keturias iš esmės naujas tyrimų sritis:

Eksperimentų planavimo matematinių metodų kūrimas ir įgyvendinimas;

Neskaitinio pobūdžio objektų statistikos, kaip savarankiškos taikomosios matematinės statistikos krypties, kūrimas;

Statistinių metodų, atsparių nedideliems nukrypimams nuo naudojamo tikimybinio modelio, kūrimas;

Plačiai plėtojamas darbas kuriant kompiuterių programinės įrangos paketus, skirtus statistinei duomenų analizei.

Tikimybiniai-statistiniai metodai ir optimizavimas. Optimizavimo idėja persmelkia šiuolaikinę taikomąją matematinę statistiką ir kitus statistinius metodus. Būtent eksperimentų planavimo metodai, statistinė priėmimo kontrolė, statistinis technologinių procesų reguliavimas ir kt. Kita vertus, optimizavimo formuluotės sprendimų priėmimo teorijoje, pavyzdžiui, taikomoji gaminių kokybės optimizavimo teorija ir standartiniai reikalavimai, numato plačiai naudojami tikimybinės statistikos metodai, pirmiausia taikoma matematinė statistika.

Gamybos valdyme, ypač optimizuojant gaminių kokybę ir standartinius reikalavimus, ypač svarbu taikyti statistinius metodus pradiniame gaminio gyvavimo ciklo etape, t.y. tiriamojo projekto rengimo etape (perspektyvių gaminio reikalavimų parengimas, preliminarus projektas, eksperimentinio projekto rengimo techninės specifikacijos). Taip yra dėl ribotos informacijos pradiniame gaminio gyvavimo ciklo etape ir poreikio numatyti technines galimybes bei ekonominę situaciją ateičiai. Statistiniai metodai turėtų būti naudojami visuose optimizavimo uždavinio sprendimo etapuose – keičiant kintamuosius, kuriant matematinius produktų ir sistemų veikimo modelius, atliekant techninius ir ekonominius eksperimentus ir kt.

Optimizavimo uždaviniuose, įskaitant produktų kokybės optimizavimą ir standartinius reikalavimus, naudojamos visos statistikos sritys. Būtent atsitiktinių dydžių statistika, daugiamatė statistinė analizė, atsitiktinių procesų ir laiko eilučių statistika, neskaitinio pobūdžio objektų statistika. Konkrečių duomenų analizės statistinį metodą patartina pasirinkti pagal rekomendacijas.

Siųsti savo gerą darbą žinių bazėje yra paprasta. Naudokite žemiau esančią formą

Studentai, magistrantai, jaunieji mokslininkai, kurie naudojasi žinių baze savo studijose ir darbe, bus jums labai dėkingi.

Paskelbta http://www.allbest.ru/

Paskelbta http://www.allbest.ru/

Įvadas

1. Chi kvadrato skirstinys

Išvada

Taikymas

Įvadas

Kaip mūsų gyvenime naudojami tikimybių teorijos požiūriai, idėjos ir rezultatai? matematinė kvadrato teorija

Pagrindas – tikimybinis realaus reiškinio ar proceso modelis, t.y. matematinis modelis, kuriame objektyvūs santykiai išreiškiami tikimybių teorija. Tikimybės pirmiausia naudojamos apibūdinti neapibrėžtumams, į kuriuos reikia atsižvelgti priimant sprendimus. Tai reiškia ir nepageidaujamas galimybes (rizika), ir patrauklias ("laimingas šansas"). Kartais atsitiktinumas yra sąmoningai įvedamas į situaciją, pavyzdžiui, traukiant burtus, atsitiktinai pasirenkant vienetus kontrolei, organizuojant loterijas ar vartotojų apklausas.

Tikimybių teorija leidžia apskaičiuoti kitas tyrėją dominančias tikimybes.

Tikimybinis reiškinio ar proceso modelis yra matematinės statistikos pagrindas. Naudojamos dvi lygiagrečios sąvokų serijos – susijusios su teorija (tikimybinis modelis) ir susijusios su praktika (stebėjimo rezultatų atranka). Pavyzdžiui, teorinė tikimybė atitinka dažnį, rastą iš imties. Matematinis lūkestis (teorinė eilutė) atitinka imties aritmetinį vidurkį (praktinę eilutę). Paprastai imties charakteristikos yra teorinės įverčiai. Tuo pačiu metu dydžiai, susiję su teorine serija „tyrėjų galvose“, yra susiję su idėjų pasauliu (anot senovės graikų filosofo Platono) ir nėra prieinami tiesioginiam matavimui. Tyrėjai turi tik pavyzdinius duomenis, kuriais jie bando nustatyti juos dominančias teorinio tikimybinio modelio savybes.

Kodėl mums reikia tikimybinio modelio? Faktas yra tas, kad tik su jo pagalba konkretaus mėginio analizės nustatytas savybes galima perkelti į kitus mėginius, taip pat į visą vadinamąją bendrą populiaciją. Sąvoka „populiacija“ vartojama kalbant apie didelę, bet baigtinę tiriamų vienetų kolekciją. Pavyzdžiui, apie visų Rusijos gyventojų visumą arba visų Maskvos tirpios kavos vartotojų visumą. Rinkodaros ar sociologinių tyrimų tikslas yra perkelti teiginius, gautus iš šimtų ar tūkstančių žmonių imties, kelių milijonų žmonių populiacijoms. Kontroliuojant kokybę, produktų partija veikia kaip bendra visuma.

Norint perkelti imties išvadas į didesnę populiaciją, reikia tam tikrų prielaidų apie imties charakteristikų ryšį su šios didesnės populiacijos savybėmis. Šios prielaidos yra pagrįstos atitinkamu tikimybiniu modeliu.

Žinoma, galima apdoroti imties duomenis ir nenaudojant vieno ar kito tikimybinio modelio. Pavyzdžiui, galite apskaičiuoti imties aritmetinį vidurkį, suskaičiuoti tam tikrų sąlygų įvykdymo dažnumą ir pan. Tačiau skaičiavimo rezultatai bus susiję tik su konkrečia imtimi, jų pagalba gautų išvadų perkėlimas į bet kurią kitą populiaciją yra neteisingas. Ši veikla kartais vadinama „duomenų analize“. Palyginti su tikimybiniais-statistiniais metodais, duomenų analizė turi ribotą edukacinę vertę.

Taigi, tikimybinių modelių, pagrįstų hipotezių įvertinimu ir tikrinimu, naudojant imties charakteristikas, naudojimas yra tikimybinių-statistinių sprendimų priėmimo metodų esmė.

1. Chi kvadrato skirstinys

Naudojant normalųjį skirstinį, apibrėžiami trys skirstiniai, kurie dabar dažnai naudojami apdorojant statistinius duomenis. Tai yra Pearsono („chi kvadratas“), Studento ir Fisherio skirstiniai.

Mes sutelksime dėmesį į paskirstymą („chi kvadratas“). Pirmą kartą šį pasiskirstymą ištyrė astronomas F. Helmertas 1876 m. Ryšium su Gauso klaidų teorija, jis ištyrė n nepriklausomų standartiškai normaliai paskirstytų atsitiktinių dydžių kvadratų sumas. Vėliau Karlas Pearsonas šiai paskirstymo funkcijai suteikė pavadinimą „chi kvadratas“. Ir dabar platinimas turi jo vardą.

Dėl glaudaus ryšio su normaliuoju skirstiniu h2 skirstinys vaidina svarbų vaidmenį tikimybių teorijoje ir matematinėje statistikoje. H2 skirstinys ir daugelis kitų skirstinių, kuriuos lemia h2 skirstinys (pavyzdžiui, Stjudento skirstinys), apibūdina įvairių funkcijų imčių skirstinius iš normaliai paskirstytų stebėjimo rezultatų ir yra naudojami pasikliautiniesiems intervalams ir statistiniams testams sudaryti.

Pirsono skirstinys (chi - kvadratas) - atsitiktinio dydžio skirstinys, kur X1, X2,..., Xn yra normalūs nepriklausomi atsitiktiniai dydžiai, o kiekvieno iš jų matematinė lūkestis yra lygus nuliui, o standartinis nuokrypis yra vienas.

Kvadratų suma

paskirstytas pagal įstatymą („chi - kvadratas“).

Šiuo atveju terminų skaičius, t.y. n vadinamas chi kvadrato skirstinio „laisvės laipsnių skaičiumi“. Didėjant laisvės laipsnių skaičiui, pasiskirstymas pamažu artėja prie normalaus.

Šio skirstinio tankis

Taigi, skirstinys h2 priklauso nuo vieno parametro n – laisvės laipsnių skaičiaus.

Paskirstymo funkcija h2 turi tokią formą:

jei h2?0. (2.7.)

1 paveiksle parodytas skirtingų laisvės laipsnių tikimybių tankio ir h2 pasiskirstymo funkcijų grafikas.

1 pav. Tikimybės tankio q (x) priklausomybė skirstinyje h2 (chi – kvadratas) skirtingiems laisvės laipsnių skaičiams

Chi kvadrato pasiskirstymo momentai:

Chi kvadrato skirstinys naudojamas vertinant dispersiją (naudojant pasikliautinąjį intervalą), tikrinant sutapimo, homogeniškumo, nepriklausomumo hipotezes, pirmiausia kokybiniams (kategorizuotiems) kintamiesiems, kurie turi baigtinį skaičių reikšmių, ir atliekant daugelį kitų statistinių duomenų analizės užduočių. .

2. „Chi kvadratas“ statistinių duomenų analizės uždaviniuose

Statistiniai duomenų analizės metodai taikomi beveik visose žmogaus veiklos srityse. Jie naudojami, kai reikia gauti ir pagrįsti bet kokius sprendimus dėl grupės (objektų ar subjektų), turinčios tam tikrą vidinį nevienalytiškumą.

Šiuolaikinį statistinių metodų raidos etapą galima skaičiuoti nuo 1900 m., kai anglas K. Pearsonas įkūrė žurnalą „Biometrika“. Pirmasis XX amžiaus trečdalis. praėjo po parametrinės statistikos ženklu. Metodai buvo tiriami remiantis Pirsonų šeimos kreivėmis aprašytų parametrinių skirstinių šeimų duomenų analize. Populiariausias buvo normalus paskirstymas. Hipotezėms patikrinti buvo naudojami Pearsono, Studento ir Fisherio testai. Pasiūlytas maksimalios tikimybės metodas ir dispersinė analizė, suformuluotos pagrindinės eksperimento planavimo idėjos.

Chi kvadrato skirstinys yra vienas plačiausiai naudojamų statistikoje statistinėms hipotezėms tikrinti. Remiantis chi kvadrato pasiskirstymu, sukonstruotas vienas galingiausių tinkamumo testų – Pearsono chi kvadrato testas.

Sutapimo kriterijus yra hipotezės apie tariamą nežinomo skirstinio dėsnį tikrinimo kriterijus.

Testas h2 („chi kvadratas“) naudojamas įvairių skirstinių hipotezėms patikrinti. Tai jo orumas.

Kriterijaus skaičiavimo formulė lygi

kur m ir m" yra atitinkamai empiriniai ir teoriniai dažniai

aptariamas platinimas;

n yra laisvės laipsnių skaičius.

Norėdami patikrinti, turime palyginti empirinius (stebėtus) ir teorinius (apskaičiuotus pagal normalaus skirstinio prielaidą) dažnius.

Jei empiriniai dažniai visiškai sutampa su apskaičiuotais arba numatomais dažniais, S (E - T) = 0 ir h2 kriterijus taip pat bus lygus nuliui. Jei S (E - T) nėra lygus nuliui, tai parodys neatitikimą tarp apskaičiuotų dažnių ir empirinių serijų dažnių. Tokiais atvejais būtina įvertinti kriterijaus h2 reikšmingumą, kuris teoriškai gali svyruoti nuo nulio iki begalybės. Tai daroma lyginant tikrąją h2f reikšmę su jos kritine verte (h2st). Nulinė hipotezė, t. y. prielaida, kad neatitikimas tarp empirinio ir teorinio arba numatomo dažnio yra atsitiktinis, paneigiama, jei h2f yra didesnis arba lygus h2st. priimtam reikšmingumo lygiui (a) ir laisvės laipsnių skaičiui (n).

Atsitiktinio dydžio h2 tikėtinų reikšmių pasiskirstymas yra tolydis ir asimetriškas. Jis priklauso nuo laisvės laipsnių skaičiaus (n) ir artėja prie normalaus pasiskirstymo, kai didėja stebėjimų skaičius. Todėl h2 kriterijaus taikymas diskrečiųjų skirstinių vertinimui yra susijęs su kai kuriomis klaidomis, kurios turi įtakos jo vertei, ypač mažose imtyse. Norint gauti tikslesnius įverčius, į variacijų eilutes paskirstytoje imtyje turi būti bent 50 parinkčių. Teisingas kriterijaus h2 taikymas taip pat reikalauja, kad variantų dažnis ekstremaliose klasėse būtų ne mažesnis kaip 5; jei jų yra mažiau nei 5, tai jie derinami su gretimų klasių dažniais taip, kad bendra suma būtų didesnė arba lygi 5. Pagal dažnių derinį klasių (N) skaičius mažėja. Laisvės laipsnių skaičius nustatomas pagal antrinį klasių skaičių, atsižvelgiant į variacijos laisvės apribojimų skaičių.

Kadangi h2 kriterijaus nustatymo tikslumas labai priklauso nuo teorinių dažnių (T) skaičiavimo tikslumo, empirinio ir skaičiuojamojo dažnių skirtumui gauti reikia naudoti nesuapvalintus teorinius dažnius.

Kaip pavyzdį paimkime tyrimą, paskelbtą svetainėje, skirtoje statistinių metodų taikymui humanitariniuose moksluose.

Chi kvadrato testas leidžia palyginti dažnio pasiskirstymą, neatsižvelgiant į tai, ar jie pasiskirstę normaliai, ar ne.

Dažnis nurodo įvykio įvykių skaičių. Dažniausiai įvykių pasireiškimo dažnumas sprendžiamas tada, kai kintamieji matuojami pavadinimų skalėje, o kitų jų charakteristikų, be dažnumo, parinkti neįmanoma arba sunku pasirinkti. Kitaip tariant, kai kintamasis turi kokybines charakteristikas. Be to, daugelis tyrinėtojų linkę paversti testų balus į lygius (aukštus, vidutinius, žemus) ir sudaryti balų pasiskirstymo lenteles, kad išsiaiškintų žmonių, turinčių šiuos lygius, skaičių. Norint įrodyti, kad viename iš lygių (vienoje iš kategorijų) žmonių skaičius tikrai didesnis (mažiau), naudojamas ir Chi kvadrato koeficientas.

Pažvelkime į paprasčiausią pavyzdį.

Jaunesnių paauglių savigarbai nustatyti buvo atliktas testas. Testo balai buvo paversti į tris lygius: aukštą, vidutinį, žemą. Dažniai buvo paskirstyti taip:

Aukštas (B) 27 žmonės.

Vidutiniškai (C) 12 žmonių.

Žemas (L) 11 žmonių

Akivaizdu, kad dauguma vaikų turi aukštą savigarbą, tačiau tai reikia įrodyti statistiškai. Norėdami tai padaryti, naudojame Chi kvadrato testą.

Mūsų užduotis – patikrinti, ar gauti empiriniai duomenys skiriasi nuo teoriškai vienodai tikėtinų. Norėdami tai padaryti, turite rasti teorinius dažnius. Mūsų atveju teoriniai dažniai yra vienodai tikėtini dažniai, kurie randami sudėjus visus dažnius ir padalijus iš kategorijų skaičiaus.

Mūsų atveju:

(B + C + H) / 3 = (27 + 12 + 11) / 3 = 16,6

Chi kvadrato testo apskaičiavimo formulė:

h2 = ?(E - T)I / T

Statome stalą:

Empirinis (E)

Teorinis (T)

(E - T)I / T

Raskite paskutinio stulpelio sumą:

Dabar, naudodami kritinių verčių lentelę (1 lentelė priede), turite rasti kriterijaus reikšmę. Norėdami tai padaryti, mums reikia laisvės laipsnių skaičiaus (n).

n = (R - 1) * (C - 1)

kur R yra lentelės eilučių skaičius, C yra stulpelių skaičius.

Mūsų atveju yra tik vienas stulpelis (tai reiškia pradinius empirinius dažnius) ir trys eilutės (kategorijos), todėl formulė keičiasi – stulpelius išskiriame.

n = (R - 1) = 3-1 = 2

Klaidos tikimybės p?0,05 ir n = 2 kritinė reikšmė yra h2 = 5,99.

Gauta empirinė reikšmė didesnė už kritinę reikšmę – dažnių skirtumai reikšmingi (h2 = 9,64; p? 0,05).

Kaip matote, kriterijų apskaičiuoti labai paprasta ir neužima daug laiko. Praktinė chi kvadrato testo vertė yra didžiulė. Šis metodas yra vertingiausias analizuojant atsakymus į klausimynus.

Pažvelkime į sudėtingesnį pavyzdį.

Pavyzdžiui, psichologas nori sužinoti, ar tiesa, kad mokytojai labiau linkę į berniukus nei į mergaites. Tie. dažniau giria merginas. Tam psichologė išanalizavo mokytojų užrašytas mokinių charakteristikas dėl trijų žodžių: „aktyvus“, „stropus“, „drausmingas“ atsiradimo dažnumo, taip pat buvo suskaičiuoti žodžių sinonimai.

Duomenys apie žodžių pasireiškimo dažnumą buvo įrašyti į lentelę:

Norėdami apdoroti gautus duomenis, naudojame chi kvadrato testą.

Tam sudarysime empirinių dažnių pasiskirstymo lentelę, t.y. dažniai, kuriuos stebime:

Teoriškai tikimės, kad dažniai pasiskirstys vienodai, t.y. dažnis bus proporcingai paskirstytas tarp berniukų ir mergaičių. Sudarykime teorinių dažnių lentelę. Norėdami tai padaryti, padauginkite eilutės sumą iš stulpelio sumos ir gautą skaičių padalinkite iš visos sumos (-ų).

Galutinė skaičiavimų lentelė atrodys taip:

Empirinis (E)

Teorinis (T)

(E - T)I / T

Berniukai

"Aktyvus"

"Stropus"

"Disciplinuotas"

"Aktyvus"

"Stropus"

"Disciplinuotas"

Suma: 4,21

h2 = ?(E - T)I / T

kur R yra lentelės eilučių skaičius.

Mūsų atveju chi kvadratas = 4,21; n = 2.

Naudodamiesi kriterijaus kritinių verčių lentele, randame: kai n = 2 ir klaidos lygis 0,05, kritinė reikšmė h2 = 5,99.

Gauta vertė yra mažesnė už kritinę vertę, o tai reiškia, kad nulinė hipotezė yra priimta.

Išvada: mokytojai, rašydami jam charakteristikas, neteikia reikšmės vaiko lyčiai.

Išvada

Beveik visų specialybių studentai aukštojo matematikos kurso pabaigoje studijuoja skyrių „Tikimybių teorija ir matematinė statistika“, jie susipažįsta tik su kai kuriomis pagrindinėmis sąvokomis ir rezultatais, kurių praktiškai neužtenka. Su kai kuriais matematiniais tyrimo metodais studentai supažindinami specialiuose kursuose (pvz., „Prognozavimas ir techninis bei ekonominis planavimas“, „Techninė ir ekonominė analizė“, „Gaminių kokybės kontrolė“, „Rinkodara“, „Kontrolė“, „Matematiniai prognozavimo metodai). ) “, „Statistika“ ir kt. – ekonominių specialybių studentų atveju), tačiau daugeliu atvejų pateikimas yra labai sutrumpintas ir formulinio pobūdžio. Dėl to taikomosios statistikos specialistų žinios yra nepakankamos.

Todėl technikos universitetuose didelę reikšmę turi „Taikomosios statistikos“, o ekonomikos universitetuose – „Ekonometrijos“, nes ekonometrija, kaip žinia, yra konkrečių ekonominių duomenų statistinė analizė.

Tikimybių teorija ir matematinė statistika suteikia pagrindinių žinių taikomajai statistikai ir ekonometrijai.

Jos reikalingos specialistams praktiniam darbui.

Pažvelgiau į ištisinį tikimybinį modelį ir bandžiau parodyti jo naudojimą pavyzdžiais.

Ir baigdamas savo darbą priėjau prie išvados, kad kompetentingas pagrindinių matematinės-statinės duomenų analizės ir statinio hipotezių tikrinimo procedūrų įgyvendinimas neįmanomas be chi kvadrato modelio žinių ir gebėjimo jį panaudoti. stalo.

Bibliografija

1. Orlovas A.I. Taikomoji statistika. M.: Leidykla „Egzaminas“, 2004 m.

2. Gmurmanas V.E. Tikimybių teorija ir matematinė statistika. M.: Aukštoji mokykla, 1999. - 479 p.

3. Ayvozyan S.A. Tikimybių teorija ir taikomoji statistika, 1 t. M.: Vienybė, 2001. - 656 p.

4. Khamitovas G.P., Vedernikova T.I. Tikimybės ir statistika. Irkutskas: BGUEP, 2006 - 272 p.

5. Ezhova L.N. Ekonometrija. Irkutskas: BGUEP, 2002. - 314 p.

6. Mostelleris F. Penkiasdešimt linksmų tikimybinių problemų su sprendimais. M.: Nauka, 1975. - 111 p.

7. Mostelleris F. Tikimybė. M.: Mir, 1969. - 428 p.

8. Yaglom A.M. Tikimybė ir informacija. M.: Nauka, 1973. - 511 p.

9. Čistjakovas V.P. Tikimybių teorijos kursas. M.: Nauka, 1982. - 256 p.

10. Kremer N.Sh. Tikimybių teorija ir matematinė statistika. M.: VIENYBĖ, 2000. - 543 p.

11. Matematinė enciklopedija, t.1. M.: Tarybinė enciklopedija, 1976. - 655 p.

12. http://psystat.at.ua/ – Psichologijos ir pedagogikos statistika. Straipsnis Chi kvadrato testas.

Taikymas

Kritiniai skirstymo taškai h2

1 lentelė

Paskelbta Allbest.ru

...

Panašūs dokumentai

    Tikimybinis modelis ir aksiomatika A.N. Kolmogorovas. Atsitiktiniai dydžiai ir vektoriai, klasikinė tikimybių teorijos ribinė problema. Pirminis statistinių duomenų apdorojimas. Skaitinių charakteristikų taškiniai įverčiai. Statistinis hipotezių tikrinimas.

    vadovas, pridėtas 2010-02-03

    Korespondencijos skyriaus testų atlikimo ir pildymo taisyklės. Matematinės statistikos ir tikimybių teorijos uždavinių sprendimo užduotys ir pavyzdžiai. Skirstinių etaloninių duomenų lentelės, standartinio normaliojo skirstinio tankis.

    mokymo vadovas, pridėtas 2009-11-29

    Pagrindiniai atsitiktinių reiškinių formalizuoto aprašymo ir analizės metodai, fizikinių ir skaitinių eksperimentų rezultatų apdorojimas ir analizė tikimybių teorijoje. Pagrindinės tikimybių teorijos sąvokos ir aksiomos. Pagrindinės matematinės statistikos sąvokos.

    paskaitų kursas, pridėtas 2011-08-04

    Matematinės statistikos matavimo rezultatų tikimybių pasiskirstymo dėsnio nustatymas. Empirinio skirstinio atitikimo teoriniam tikrinimas. Pasikliautinio intervalo, kuriame yra išmatuoto dydžio reikšmė, nustatymas.

    kursinis darbas, pridėtas 2012-11-02

    Atsitiktinių dydžių ir tikimybių skirstinių sekų konvergencija. Būdingųjų funkcijų metodas. Statistinių hipotezių tikrinimas ir centrinės ribos teoremos atlikimas nurodytoms nepriklausomų atsitiktinių dydžių sekoms.

    kursinis darbas, pridėtas 2012-11-13

    Pagrindiniai gamtinių stebėjimų duomenų apdorojimo etapai naudojant matematinės statistikos metodą. Gautų rezultatų įvertinimas, panaudojimas priimant valdymo sprendimus gamtosaugos ir aplinkos tvarkymo srityje. Statistinių hipotezių tikrinimas.

    praktinis darbas, pridėtas 2013-05-24

    Paskirstymo dėsnio esmė ir praktinis pritaikymas statistikos uždaviniams spręsti. Atsitiktinio dydžio dispersijos, matematinės lūkesčių ir standartinio nuokrypio nustatymas. Vienpusės dispersinės analizės ypatumai.

    testas, pridėtas 2013-12-07

    Tikimybė ir jos bendras apibrėžimas. Tikimybių sudėties ir daugybos teoremos. Diskretieji atsitiktiniai dydžiai ir jų skaitinės charakteristikos. Didelių skaičių dėsnis. Imties statistinis pasiskirstymas. Koreliacinės ir regresinės analizės elementai.

    paskaitų kursas, pridėtas 2015-06-13

    Kurso programa, pagrindinės tikimybių teorijos sąvokos ir formulės, jų pagrindimas ir reikšmė. Matematinės statistikos vieta ir vaidmuo disciplinoje. Pavyzdžiai ir paaiškinimai, kaip spręsti dažniausiai pasitaikančias problemas įvairiomis temomis šiose akademinėse disciplinose.

    mokymo vadovas, pridėtas 2010-01-15

    Tikimybių teorija ir matematinė statistika yra masinių atsitiktinių reiškinių kiekybinės analizės metodų mokslai. Atsitiktinių dydžių reikšmių rinkinys vadinamas imtimi, o aibės elementai – atsitiktinio dydžio imties reikšmėmis.

Pagal tris pagrindines galimybes – sprendimų priėmimą visiško tikrumo, rizikos ir neapibrėžtumo sąlygomis – sprendimų priėmimo metodus ir algoritmus galima suskirstyti į tris pagrindinius tipus: analitinį, statistinį ir pagrįstą neaiškiu formalizavimu. Kiekvienu konkrečiu atveju sprendimo priėmimo būdas parenkamas atsižvelgiant į atliekamą užduotį, turimus šaltinio duomenis, turimus problemų modelius, sprendimų priėmimo aplinką, sprendimo priėmimo procesą, reikalingą sprendimo tikslumą ir asmenines analitiko pageidavimus.

Kai kuriose informacinėse sistemose algoritmo pasirinkimo procesas gali būti automatizuotas:

Atitinkama automatizuota sistema turi galimybę naudoti daugybę skirtingų tipų algoritmų (algoritmų biblioteka);

Sistema interaktyviai ragina vartotoją atsakyti į daugybę klausimų apie pagrindines nagrinėjamos užduoties charakteristikas;

Sistema pagal vartotojo atsakymų rezultatus pasiūlo tinkamiausią (pagal joje nurodytus kriterijus) algoritmą iš bibliotekos.

2.3.1 Tikimybiniai ir statistiniai sprendimų priėmimo metodai

Tikimybiniai-statistiniai sprendimų priėmimo metodai (PSD) taikomi tuo atveju, kai priimamų sprendimų efektyvumas priklauso nuo faktorių, kurie yra atsitiktiniai dydžiai, kuriems žinomi tikimybių pasiskirstymo dėsniai ir kitos statistinės charakteristikos. Be to, kiekvienas sprendimas gali lemti vieną iš daugelio galimų pasekmių, o kiekvienas rezultatas turi tam tikrą pasireiškimo tikimybę, kurią galima apskaičiuoti. Probleminę situaciją apibūdinantys rodikliai taip pat aprašomi naudojant tikimybines charakteristikas. Taikant tokį ZPR, sprendimų priėmėjas visada rizikuoja gauti ne tokį rezultatą, į kurį jis orientuojasi, rinkdamasis optimalų sprendimą pagal atsitiktinių veiksnių statistinių charakteristikų vidurkį. , tai yra, sprendimas priimamas rizikos sąlygomis.

Praktikoje dažnai naudojami tikimybiniai ir statistiniai metodai, kai iš imties duomenų padarytos išvados perduodamos visai populiacijai (pavyzdžiui, iš imties į visą produktų partiją). Tačiau kiekvienoje konkrečioje situacijoje pirmiausia reikėtų įvertinti esminę galimybę gauti pakankamai patikimus tikimybinius ir statistinius duomenis.

Priimant sprendimus panaudojant tikimybių teorijos ir matematinės statistikos idėjas ir rezultatus, pagrindas yra matematinis modelis, kuriame objektyvūs ryšiai išreiškiami tikimybių teorija. Tikimybės pirmiausia naudojamos atsitiktinumui, į kurį reikia atsižvelgti priimant sprendimus, apibūdinti. Tai reiškia ir nepageidaujamas galimybes (rizika), ir patrauklias ("laimingas šansas").

Tikimybinių-statistinių sprendimų priėmimo metodų esmė yra tikimybinių modelių, pagrįstų hipotezių įvertinimu ir tikrinimu, naudojant imties charakteristikas, naudojimas..

Pabrėžiame, kad imties charakteristikų naudojimo logika priimant sprendimus remiantis teoriniais modeliais apima dviejų lygiagrečių sąvokų serijų naudojimą vienu metu– susiję su teorija (tikimybinis modelis) ir su praktika (stebėjimo rezultatų atranka). Pavyzdžiui, teorinė tikimybė atitinka dažnį, rastą iš imties. Matematinis lūkestis (teorinė eilutė) atitinka imties aritmetinį vidurkį (praktinę eilutę). Paprastai imties charakteristikos yra teorinių charakteristikų įvertinimai.

Šių metodų naudojimo pranašumai apima galimybę atsižvelgti į įvairius įvykių raidos scenarijus ir jų tikimybes. Šių metodų trūkumas yra tas, kad skaičiavimuose naudojamų scenarijų tikimybių reikšmes praktiškai labai sunku gauti.

Konkretaus tikimybinio-statistinio sprendimų priėmimo metodo taikymas susideda iš trijų etapų:

Perėjimas nuo ekonominės, vadybinės, technologinės realybės prie abstrakčios matematinės ir statistinės schemos, t.y. tikimybinio valdymo sistemos modelio konstravimas, technologinis procesas, sprendimų priėmimo procedūra, ypač remiantis statistinės kontrolės rezultatais ir kt.

Skaičiavimų ir išvadų darymas grynai matematinėmis priemonėmis tikimybinio modelio rėmuose;

Matematinių ir statistinių išvadų, susijusių su realia situacija, interpretavimas ir tinkamo sprendimo priėmimas (pavyzdžiui, dėl gaminio kokybės atitikties ar neatitikimo nustatytiems reikalavimams, būtinybės koreguoti technologinį procesą ir pan.), visų pirma, išvados (dėl brokuotų gaminio vienetų proporcijos partijoje, dėl konkrečios technologinio proceso valdomų parametrų pasiskirstymo dėsnių formos ir kt.).

Tikimybinis realaus reiškinio modelis turėtų būti laikomas sukonstruotu, jei nagrinėjami dydžiai ir ryšiai tarp jų išreikšti tikimybių teorija. Tikimybinio modelio adekvatumas yra pagrįstas, ypač naudojant statistinius hipotezių tikrinimo metodus.

Pagal sprendžiamos problemos tipą matematinė statistika paprastai skirstoma į tris dalis: duomenų aprašymas, įvertinimas ir hipotezių tikrinimas. Atsižvelgiant į apdorojamų statistinių duomenų tipą, matematinė statistika skirstoma į keturias sritis:

Vienamatė statistika (atsitiktinių dydžių statistika), kurioje stebėjimo rezultatas apibūdinamas realiuoju skaičiumi;

Daugiamatė statistinė analizė, kai objekto stebėjimo rezultatas apibūdinamas keliais skaičiais (vektoriu);

Atsitiktinių procesų ir laiko eilučių statistika, kur stebėjimo rezultatas yra funkcija;

Neskaitinio pobūdžio objektų statistika, kai stebėjimo rezultatas yra neskaitinio pobūdžio, pavyzdžiui, tai yra aibė (geometrinė figūra), tvarka arba gautas matavimo rezultatas. pagal kokybinį kriterijų.

Pavyzdys, kada patartina naudoti tikimybinius-statistinius modelius.

Kontroliuojant bet kurio gaminio kokybę, iš jo parenkamas pavyzdys, kad būtų nuspręsta, ar gaminamos produkcijos partija atitinka nustatytus reikalavimus. Remiantis mėginio kontrolės rezultatais, daroma išvada apie visą partiją. Šiuo atveju formuojant imtį labai svarbu vengti subjektyvumo, tai yra būtina, kad kiekvienas kontroliuojamos partijos gaminio vienetas turėtų vienodą tikimybę būti atrinktam į mėginį. Atranka pagal lotą tokioje situacijoje nėra pakankamai objektyvi. Todėl gamybinėmis sąlygomis prekės vienetų atranka imčiai dažniausiai vyksta ne burtų keliu, o specialiomis atsitiktinių skaičių lentelėmis arba naudojant kompiuterinius atsitiktinių skaičių jutiklius.

Technologinių procesų statistiniame reglamentavime, remiantis matematinės statistikos metodais, rengiamos statistinių procesų valdymo taisyklės ir planai, kuriais siekiama laiku aptikti technologinių procesų problemas ir imtis priemonių joms koreguoti bei užkirsti kelią gaminių, kurie nėra atitinka nustatytus reikalavimus. Šiomis priemonėmis siekiama sumažinti gamybos sąnaudas ir nuostolius dėl nekokybiškų vienetų tiekimo. Atliekant statistinę priėmimo kontrolę, remiantis matematinės statistikos metodais, analizuojant gaminių partijų mėginius, sudaromi kokybės kontrolės planai. Sunkumas slypi gebėjime teisingai sukurti tikimybinius-statistinius sprendimų priėmimo modelius, kuriais remiantis būtų galima atsakyti į aukščiau pateiktus klausimus. Matematinės statistikos srityje tam buvo sukurti tikimybiniai modeliai ir hipotezių tikrinimo metodai3.

Be to, daugelyje vadybinių, gamybinių, ekonominių ir šalies ekonominių situacijų iškyla kitokio pobūdžio problemos – tikimybių skirstinių charakteristikų ir parametrų vertinimo problemos.

Arba, statistiškai analizuojant technologinių procesų tikslumą ir stabilumą, reikia įvertinti tokius kokybės rodiklius kaip vidutinė kontroliuojamo parametro reikšmė ir jo sklaidos laipsnis nagrinėjamame procese. Pagal tikimybių teoriją, kaip vidutinę atsitiktinio dydžio reikšmę, patartina naudoti jos matematinį lūkestį, o kaip statistinę sklaidos charakteristiką – dispersiją, standartinį nuokrypį arba variacijos koeficientą. Tai kelia klausimą: kaip įvertinti šias statistines charakteristikas pagal imties duomenis ir kokiu tikslumu tai galima padaryti? Literatūroje yra daug panašių pavyzdžių. Visi jie parodo, kaip tikimybių teorija ir matematinė statistika gali būti panaudota gamybos valdyme priimant sprendimus statistinių produktų kokybės valdymo srityje.

Konkrečiose taikymo srityse naudojami tiek tikimybiniai, tiek statistiniai bendrojo taikymo ir specifiniai metodai. Pavyzdžiui, gamybos valdymo skyriuje, skirtoje statistiniams gaminių kokybės valdymo metodams, naudojama taikomoji matematinė statistika (įskaitant ir eksperimentų planavimą). Jos metodais atliekama statistinė technologinių procesų tikslumo ir stabilumo analizė bei statistinis kokybės vertinimas. Konkretūs metodai apima gaminių kokybės statistinės priėmimo kontrolės, technologinių procesų statistinio reguliavimo, patikimumo vertinimo ir kontrolės metodus ir kt.

Gamybos valdyme, ypač optimizuojant gaminių kokybę ir užtikrinant atitiktį standartiniams reikalavimams, statistinius metodus ypač svarbu taikyti pradiniame gaminio gyvavimo ciklo etape, t.y. tiriamojo projekto rengimo etape (perspektyvių gaminio reikalavimų parengimas, preliminarus projektas, eksperimentinio projekto rengimo techninės specifikacijos). Taip yra dėl ribotos informacijos pradiniame gaminio gyvavimo ciklo etape ir poreikio numatyti technines galimybes bei ekonominę situaciją ateičiai.

Labiausiai paplitę tikimybinės statistikos metodai yra regresinė analizė, faktorinė analizė, dispersinė analizė, statistiniai rizikos vertinimo metodai, scenarijų metodas ir kt. Statistinių metodų sritis, skirta neskaitinio pobūdžio, t.y., statistinių duomenų analizei tampa vis svarbesnė. matavimo rezultatai, pagrįsti kokybinėmis ir skirtingų tipų charakteristikomis. Vienas pagrindinių neskaitinio pobūdžio objektų statistikos pritaikymo būdų yra ekspertinių vertinimų, susijusių su statistinių sprendimų teorija ir balsavimo problemomis, teorija ir praktika.

Žmogaus vaidmuo sprendžiant problemas naudojant statistinių sprendimų teorijos metodus yra uždavinį išdėstyti, t.y. realią problemą redukuoti iki atitinkamos standartinės, remiantis statistiniais duomenimis nustatyti įvykių tikimybes, o taip pat patvirtinti gautą optimalų sprendimą.

Ypač įdomus kiekybinis verslo rizikos vertinimas, naudojant matematinės statistikos metodus. Pagrindinės šio vertinimo metodo priemonės yra šios:

§ atsitiktinio dydžio atsiradimo tikimybė,

§ tiriamojo atsitiktinio dydžio matematinės lūkesčiai arba vidutinė vertė,

§ dispersija,

§ standartinis (vidutinis kvadratas) nuokrypis,

§ variacijos koeficientas,

§ tiriamojo atsitiktinio dydžio tikimybių pasiskirstymas.

Norėdami priimti sprendimą, turite žinoti rizikos dydį (laipsnį), kuris matuojamas dviem kriterijais:

1) vidutinė laukiama vertė (matematinis lūkestis),

2) galimo rezultato svyravimai (kintamumas).

Vidutinė numatoma vertė tai yra atsitiktinio dydžio svertinis vidurkis, susietas su situacijos neapibrėžtumu:

,

kur yra atsitiktinio dydžio reikšmė.

Vidutinė numatoma vertė matuoja rezultatą, kurio tikimės vidutiniškai.

Vidutinė reikšmė yra apibendrinta kokybinė charakteristika ir neleidžia priimti sprendimo dėl kokios nors konkrečios atsitiktinio dydžio reikšmės.

Norint priimti sprendimą, būtina išmatuoti rodiklių svyravimus, tai yra nustatyti galimo rezultato kintamumo matą.

Galimo rezultato kitimas yra laipsnis, kuriuo numatoma vertė nukrypsta nuo vidutinės vertės.

Šiuo tikslu praktikoje dažniausiai naudojami du glaudžiai susiję kriterijai: „dispersija“ ir „standartinis nuokrypis“.

Sklaida – faktinių rezultatų kvadratų svertinis vidurkis nuo laukiamo vidurkio:

Standartinis nuokrypis yra dispersijos kvadratinė šaknis. Tai matmenų dydis ir matuojamas tais pačiais vienetais, kuriais matuojamas tiriamasis atsitiktinis dydis:

.

Dispersija ir standartinis nuokrypis yra absoliutaus kitimo matas. Paprastai analizei naudojamas variacijos koeficientas.

Variacijos koeficientas reiškia standartinio nuokrypio ir vidutinės tikėtinos vertės santykį, padaugintą iš 100 %

arba .

Variacijos koeficientui įtakos neturi absoliučios tiriamo rodiklio reikšmės.

Naudodami variacijos koeficientą netgi galite palyginti charakteristikų, išreikštų skirtingais matavimo vienetais, svyravimus. Variacijos koeficientas gali svyruoti nuo 0 iki 100%. Kuo didesnis koeficientas, tuo didesni svyravimai.


Ekonominėje statistikoje nustatomas toks skirtingų variacijos koeficiento verčių vertinimas:

iki 10% - silpnas svyravimas, 10 - 25% - vidutinis, virš 25% - didelis.

Atitinkamai, kuo didesni svyravimai, tuo didesnė rizika.

Pavyzdys. Mažos parduotuvės savininkas kiekvienos dienos pradžioje įsigyja parduoti greitai gendantį produktą. Šio produkto vienetas kainuoja 200 UAH. Pardavimo kaina – 300 UAH. už vienetą. Iš stebėjimų žinoma, kad šios prekės paklausa per dieną gali būti 4, 5, 6 arba 7 vienetai su atitinkamomis tikimybėmis 0,1; 0,3; 0,5; 0.1. Jei produktas neparduodamas per dieną, dienos pabaigoje jis visada bus nupirktas už 150 UAH. už vienetą. Kiek vienetų šio produkto parduotuvės savininkas turėtų nusipirkti dienos pradžioje?

Sprendimas. Parduotuvės savininkui sukurkime pelno matricą. Apskaičiuokime pelną, kurį gaus savininkas, jei, pavyzdžiui, nusipirks 7 vienetus prekės, o per 6 dieną ir dienos pabaigoje parduos vieną vienetą. Kiekvienas per dieną parduotas produkto vienetas duoda 100 UAH pelno, o dienos pabaigoje – 200 – 150 = 50 UAH nuostolį. Taigi pelnas šiuo atveju bus:

Skaičiavimai atliekami panašiai ir kitiems pasiūlos ir paklausos deriniams.

Numatomas pelnas apskaičiuojamas kaip matematinis kiekvienos sudarytos matricos eilutės galimų pelno verčių lūkestis, atsižvelgiant į atitinkamas tikimybes. Kaip matote, tarp tikėtino pelno didžiausias yra 525 UAH. Tai atitinka atitinkamos prekės įsigijimą 6 vnt.

Norėdami pagrįsti galutinę rekomendaciją įsigyti reikiamą gaminio vienetų skaičių, apskaičiuojame kiekvienos galimos prekės pasiūlos ir paklausos derinio dispersiją, standartinį nuokrypį ir variacijos koeficientą (kiekviena pelno matricos eilutė):

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Kalbant apie parduotuvės savininką, perkantį 6 vienetus prekės, palyginti su 5 ir 4 vienetais, tai nėra akivaizdu, nes rizika perkant 6 vienetus prekės (19,2 proc.) yra didesnė nei perkant 5 vienetus (9,3 proc.) ir tuo labiau. nei perkant 4 vnt. (0%).

Taigi, mes turime visą informaciją apie numatomą pelną ir riziką. O kiek vienetų prekės jam reikia įsigyti kiekvieną rytą, sprendžia parduotuvės savininkas, atsižvelgdamas į savo patirtį ir rizikos apetitą.

Mūsų nuomone, parduotuvės savininkui reikėtų rekomenduoti kiekvieną rytą įsigyti 5 vienetus prekės ir jo vidutinis numatomas pelnas bus 485 UAH. ir jei palyginsite tai su 6 vienetų gaminio pirkimu, kurio vidutinis numatomas pelnas yra 525 UAH, tai yra 40 UAH. daugiau, tačiau rizika tokiu atveju bus 2,06 karto didesnė.