როგორ გამოვთვალოთ სტანდარტული გადახრა. რა არის სტანდარტული გადახრა

ცვალებადობის კოეფიციენტი არის ორი შემთხვევითი მნიშვნელობის დისპერსიის შედარება. რაოდენობებს აქვთ საზომი ერთეული, რაც შესადარებელ შედეგამდე მივყავართ. ეს კოეფიციენტი საჭიროა სტატისტიკური ანალიზის მოსამზადებლად.

მასთან ერთად ინვესტორებს შეუძლიათ გამოთვალეთ რისკის ინდიკატორებიშერჩეულ აქტივებში ინვესტიციების განხორციელებამდე. ეს სასარგებლოა, როდესაც შერჩეულ აქტივებს აქვთ განსხვავებული ანაზღაურება და რისკის ხარისხი. მაგალითად, ერთ აქტივს შეიძლება ჰქონდეს მაღალი შემოსავალი და მაღალი რისკის ხარისხი, ხოლო მეორეს, პირიქით, შეიძლება ჰქონდეს დაბალი შემოსავალი და შესაბამისად დაბალი რისკის ხარისხი.

სტანდარტული გადახრის გაანგარიშება

სტანდარტული გადახრა არის სტატისტიკური მნიშვნელობა. ამ მნიშვნელობის გამოთვლით მომხმარებელი მიიღებს ინფორმაციას იმის შესახებ, თუ რამდენად არის მონაცემები გადახრილი ამა თუ იმ მიმართულებით საშუალო მნიშვნელობასთან შედარებით. Excel-ში სტანდარტული გადახრა გამოითვლება რამდენიმე ეტაპად.

მოამზადეთ მონაცემები: გახსენით გვერდი, სადაც მოხდება გამოთვლები. ჩვენს შემთხვევაში, ეს არის სურათი, მაგრამ ეს შეიძლება იყოს ნებისმიერი სხვა ფაილი. მთავარია, შეაგროვოთ ინფორმაცია, რომელსაც გამოიყენებთ ცხრილში გამოთვლებისთვის.

შეიყვანეთ მონაცემები ნებისმიერი ცხრილის რედაქტორში (ჩვენს შემთხვევაში Excel), შეავსეთ უჯრედები მარცხნიდან მარჯვნივ. უნდა დაიწყოსსვეტიდან "A". შეიყვანეთ სათაურები ხაზში ზედა, და სახელები იმავე სვეტებში, რომლებიც ეხება სათაურებს, მხოლოდ ქვემოთ. შემდეგ თარიღი და მონაცემები გამოითვლება თარიღის მარჯვნივ.

შეინახეთ ეს დოკუმენტი.

ახლა გადავიდეთ თავად გაანგარიშებაზე. აირჩიეთ უჯრედი კურსორითქვემოთ შეყვანილი ბოლო მნიშვნელობის შემდეგ.

შეიყვანეთ "=" ნიშანი და შეიყვანეთ ფორმულა ქვემოთ. საჭიროა თანაბარი ნიშანი. წინააღმდეგ შემთხვევაში, პროგრამა არ გამოთვლის შემოთავაზებულ მონაცემებს. ფორმულა შეყვანილია სივრცეების გარეშე.

პროგრამა აჩვენებს რამდენიმე ფორმულის სახელს. აირჩიეთ " სტანდარტული გადახრა" ეს არის სტანდარტული გადახრის გამოთვლის ფორმულა. გაანგარიშების ორი ტიპი არსებობს:

ნიმუშის გაანგარიშებით;
საერთო პოპულაციაზე დაფუძნებული გაანგარიშებით.

ერთი მათგანის არჩევით, მიუთითეთ მონაცემთა დიაპაზონი. მთელი შეყვანილი ფორმულა ასე გამოიყურება: "=STDEV (B2: B5)."

შემდეგ დააჭირეთ ღილაკს ” შედი" მიღებული მონაცემები გამოჩნდება მონიშნულ ნივთში.

საშუალო არითმეტიკულის გამოთვლა

გამოითვლება, როდესაც მომხმარებელს სჭირდება ანგარიშის შექმნა, მაგალითად, მის კომპანიაში ხელფასებზე. ეს კეთდება შემდეგნაირად:

იქნება მხოლოდ დიაპაზონის არჩევადა დააჭირეთ ღილაკს "Enter". და უჯრედი ახლა აჩვენებს შედეგს ზემოთ აღებული მონაცემებიდან.

ცვალებადობის კოეფიციენტის გამოთვლა

ცვალებადობის კოეფიციენტის გამოთვლის ფორმულა:

V= S/X, სადაც S არის სტანდარტული გადახრადა X არის საშუალო მნიშვნელობა.

Excel-ში ცვალებადობის კოეფიციენტის გამოსათვლელად, თქვენ უნდა იპოვოთ სტანდარტული გადახრა და საშუალო არითმეტიკული. ანუ, პირველი ორი გამოთვლების დასრულების შემდეგ, რომლებიც ზემოთ იყო ნაჩვენები, შეგიძლიათ გადახვიდეთ ვარიაციის კოეფიციენტზე მუშაობაზე.

ამისათვის გახსენით Excel, შეავსეთ ორი ველი, სადაც უნდა შეიყვანოთ სტანდარტული გადახრის და საშუალო მნიშვნელობის შედეგად მიღებული რიცხვები.

ახლა აირჩიეთ უჯრედი, რომელიც გამოყოფილია რიცხვისთვის ვარიაციის გამოსათვლელად. გახსენით ჩანართი " მთავარი„თუ არ არის გახსნილი. დააჭირეთ ხელსაწყოს " ნომერი" აირჩიეთ პროცენტული ფორმატი.

გადადით მონიშნულ უჯრედში და ორჯერ დააწკაპუნეთ მასზე. შემდეგ შეიყვანეთ ტოლობის ნიშანი და მონიშნეთ პუნქტი, სადაც შეყვანილია მთლიანი სტანდარტული გადახრა. შემდეგ დააწკაპუნეთ თქვენს კლავიატურაზე „სლეში“ ან „გაყოფის“ ღილაკზე (გამოიყურება ასე: „/“). აირჩიეთ ელემენტი, სადაც შეყვანილია საშუალო არითმეტიკული და დააჭირეთ ღილაკს „Enter“. ეს ასე უნდა გამოიყურებოდეს:

და აი შედეგი "Enter"-ის დაჭერის შემდეგ:

თქვენ ასევე შეგიძლიათ გამოიყენოთ ცვალებადობის კოეფიციენტის გამოსათვლელად ონლაინ კალკულატორები, მაგალითად planetcalc.ru და allcalc.ru. საკმარისია შეიყვანოთ საჭირო ნომრები და დაიწყოთ გამოთვლა, რის შემდეგაც მიიღებთ საჭირო ინფორმაციას.

სტანდარტული გადახრა

Excel-ში სტანდარტული გადახრა მოგვარებულია ორი ფორმულის გამოყენებით:

მარტივი სიტყვებით, დისპერსიის ფესვი ამოღებულია. როგორ გამოვთვალოთ დისპერსიული განხილვა ქვემოთ.

სტანდარტული გადახრა სინონიმია სტანდარტული გადახრისა და ზუსტად ასევე გამოითვლება. ხაზგასმულია შედეგის უჯრედი იმ რიცხვების ქვეშ, რომლებიც უნდა გამოითვალოს. ჩასმულია ზემოთ ნახაზზე ნაჩვენები ერთ-ერთი ფუნქცია. დააჭირეთ ღილაკს ” შედი" შედეგი მიღებულია.

რხევის კოეფიციენტი

ცვალებადობის დიაპაზონის თანაფარდობას საშუალოსთან ეწოდება რხევის კოეფიციენტი. Excel-ში არ არის მზა ფორმულები, ასე რომ საჭიროა აწყობარამდენიმე ფუნქცია ერთში.

ფუნქციები, რომლებიც უნდა იყოს შერწყმული, არის საშუალო, მაქსიმალური და მინიმალური ფორმულები. ეს კოეფიციენტი გამოიყენება მონაცემთა ნაკრების შესადარებლად.

დისპერსია

ვარიაცია არის ფუნქცია, რომლითაც ახასიათებს მონაცემთა გავრცელებასირგვლივ მათემატიკური მოლოდინი. გამოითვლება შემდეგი განტოლების გამოყენებით:

ცვლადები იღებენ შემდეგ მნიშვნელობებს:

Excel-ს აქვს ორი ფუნქცია, რომელიც განსაზღვრავს დისპერსიას:

გაანგარიშების გასაკეთებლად, უჯრედი მონიშნულია იმ რიცხვების ქვეშ, რომლებიც უნდა გამოითვალოს. გადადით ჩასმის ფუნქციის ჩანართზე. აირჩიეთ კატეგორია " სტატისტიკური" ჩამოსაშლელი სიიდან აირჩიეთ ერთ-ერთი ფუნქცია და დააჭირეთ ღილაკს "Enter".

მაქსიმალური და მინიმალური

მაქსიმალური და მინიმალურია საჭირო იმისათვის, რომ ხელით არ მოძებნოთ რიცხვების დიდი რაოდენობა მინიმალური ან მაქსიმალური რიცხვისთვის.

მაქსიმუმის გამოსათვლელად, აირჩიეთ მთელი დიაპაზონისაჭირო ნომრები ცხრილში და ცალკე უჯრედში, შემდეგ დააჭირეთ "Σ" ან " ავტოსუმი" ფანჯარაში, რომელიც გამოჩნდება, აირჩიეთ "მაქსიმუმი" და ღილაკზე "Enter" დაჭერით მიიღებთ სასურველ მნიშვნელობას.

თქვენ იგივეს აკეთებთ მინიმუმის მისაღებად. უბრალოდ აირჩიეთ "მინიმალური" ფუნქცია.

მენეჯმენტის ჩარევა აუცილებელია გადახრების მიზეზების დასადგენად.

საკონტროლო დიაგრამის ასაგებად ვიყენებ ნედლეულ მონაცემებს, საშუალო (μ) და სტანდარტულ გადახრას (σ). Excel-ში: μ = საშუალო ($F$3:$F$15), σ = STANDARDEVAL($F$3:$F$15)

საკონტროლო სქემა თავისთავად მოიცავს: ნედლეულ მონაცემებს, საშუალო (μ), კონტროლის ქვედა ზღვარს (μ – 2σ) და ზედა საკონტროლო ზღვარს (μ + 2σ):

ჩამოტვირთეთ შენიშვნა ფორმატში, მაგალითები ფორმატში

წარმოდგენილი რუკის დათვალიერებისას შევამჩნიე, რომ წყაროს მონაცემები აჩვენებს ძალიან მკაფიო ხაზოვან ტენდენციას ზედნადები ხარჯების წილის შემცირებისკენ:

ტრენდის ხაზის დასამატებლად აირჩიეთ დიაგრამაზე მონაცემების მწკრივი (ჩვენს მაგალითში, მწვანე წერტილები), დააწკაპუნეთ მაუსის მარჯვენა ღილაკით და აირჩიეთ "ტენდენციის ხაზის დამატება". Trendline Format ფანჯარაში, რომელიც იხსნება, ექსპერიმენტი გააკეთეთ ოფციებით. ხაზოვან ტენდენციაზე დავმკვიდრდი.

თუ ორიგინალური მონაცემები არ არის მიმოფანტული საშუალო მნიშვნელობის ირგვლივ, მაშინ მათი აღწერა μ და σ პარამეტრებით მთლად სწორი არ არის. აღწერისთვის, საშუალო მნიშვნელობის ნაცვლად, ხაზოვანი ტენდენციის ხაზი და კონტროლის საზღვრები, რომლებიც თანაბარი მანძილით არის დაშორებული ამ ტრენდის ხაზისგან, უკეთესად შეეფერება.

Excel საშუალებას გაძლევთ შექმნათ ტრენდის ხაზი FORECAST ფუნქციის გამოყენებით. ჩვენ გვჭირდება დამატებითი რიგი A3:A15 X-ის ცნობილი მნიშვნელობებიიყო უწყვეტი სერიები (ბლოკის რიცხვები არ ქმნიან ასეთ უწყვეტ სერიას). H სვეტის საშუალო მნიშვნელობის ნაცვლად, ჩვენ შემოგთავაზებთ FORECAST ფუნქციას:

სტანდარტული გადახრა σ (STANDEVAL ფუნქცია Excel-ში) გამოითვლება ფორმულის გამოყენებით:

სამწუხაროდ, Excel-ში ვერ ვიპოვე ფუნქცია ამ გზით სტანდარტული გადახრის დასადგენად (ტენდენციის მიმართ). პრობლემის მოგვარება შესაძლებელია მასივის ფორმულის გამოყენებით. მათთვის, ვინც არ იცნობს მასივის ფორმულებს, ვთავაზობ პირველ რიგში მათ წაკითხვას.

მასივის ფორმულას შეუძლია დააბრუნოს ერთი მნიშვნელობა ან მასივი. ჩვენს შემთხვევაში, მასივის ფორმულა დააბრუნებს ერთ მნიშვნელობას:

მოდით უფრო დეტალურად განვიხილოთ, თუ როგორ მუშაობს მასივის ფორმულა G3 უჯრედში

SUM(($F$3:$F$15-$H$3:$H$15)^2) განსაზღვრავს კვადრატული სხვაობების ჯამს; სინამდვილეში ფორმულა ითვლის შემდეგ ჯამს = (F3 – H3) 2 + (F4 – H4) 2 + … + (F15 – H15) 2

COUNTA ($F$3:$F$15) – მნიშვნელობების რაოდენობა F3:F15 დიაპაზონში

SQRT(SUM(($F$3:$F$15-$H$3:$H$15)^2)/(COUNTA($F$3:$F$15)-1)) = σ

მნიშვნელობა 6.2% არის ქვედა საკონტროლო ლიმიტის წერტილი = 8.3% – 2 σ

ფორმულის ორივე მხარეს ხვეული ციტატები მიუთითებს, რომ ეს არის მასივის ფორმულა. მასივის ფორმულის შესაქმნელად, G3 უჯრედში ფორმულის შეყვანის შემდეგ:

H4 – 2*ROOT(SUM(($F$3:$F$15-$H$3:$H$15)^2)/(COUNT($F$3:$F$15)-1))

თქვენ უნდა დააჭიროთ არა Enter, არამედ Ctrl + Shift + Enter. არ შეეცადოთ კლავიატურიდან ხვეული ბრეკეტების შეყვანა - მასივის ფორმულა არ იმუშავებს. თუ თქვენ გჭირდებათ მასივის ფორმულის რედაქტირება, გააკეთეთ ეს ისევე, როგორც ჩვეულებრივი ფორმულით, მაგრამ ისევ, როდესაც დაასრულებთ რედაქტირებას, დააჭირეთ Ctrl + Shift + Enter, ვიდრე Enter.

მასივის ფორმულა, რომელიც აბრუნებს ერთ მნიშვნელობას, შეიძლება ჩვეულებრივი ფორმულის მსგავსად "ჩამოათრიოთ".

შედეგად, ჩვენ მივიღეთ საკონტროლო დიაგრამა, რომელიც შექმნილია მონაცემების შემცირებისთვის

P.S. ჩანაწერის დაწერის შემდეგ, მე შევძელი ფორმულების დახვეწა, რომლებიც გამოიყენება ტენდენციური მონაცემების სტანდარტული გადახრის გამოსათვლელად. მათი ნახვა შეგიძლიათ Excel ფაილში

ჩვენ უნდა გავუმკლავდეთ ისეთი მნიშვნელობების გამოთვლას, როგორიცაა დისპერსია, სტანდარტული გადახრა და, რა თქმა უნდა, ვარიაციის კოეფიციენტი. სწორედ ამ უკანასკნელის გამოთვლა იმსახურებს განსაკუთრებულ ყურადღებას. ძალიან მნიშვნელოვანია, რომ ყველა დამწყები, ვინც ახლა იწყებს მუშაობას ცხრილების რედაქტორთან, შეუძლია სწრაფად გამოთვალოს მნიშვნელობების გავრცელების ფარდობითი ზღვარი.

რა არის ვარიაციის კოეფიციენტი და რატომ არის საჭირო?

ასე რომ, მეჩვენება, რომ სასარგებლო იქნება მოკლე თეორიული ექსკურსიის გავლა და ვარიაციის კოეფიციენტის ბუნების გაგება. ეს მაჩვენებელი აუცილებელია მონაცემთა დიაპაზონის ასახვისთვის საშუალო მნიშვნელობასთან შედარებით. სხვა სიტყვებით რომ ვთქვათ, ის აჩვენებს სტანდარტული გადახრის თანაფარდობას საშუალოსთან. ცვალებადობის კოეფიციენტი ჩვეულებრივ იზომება პროცენტული თვალსაზრისით და გამოიყენება დროის სერიების ჰომოგენურობის საჩვენებლად.

ცვალებადობის კოეფიციენტი გახდება შეუცვლელი ასისტენტი იმ შემთხვევაში, როდესაც თქვენ გჭირდებათ პროგნოზის გაკეთება მოცემული ნიმუშის მონაცემებზე დაყრდნობით. ეს მაჩვენებელი ხაზს უსვამს მნიშვნელობების ძირითად სერიას, რომელიც ყველაზე სასარგებლო იქნება შემდგომი პროგნოზირებისთვის და ასევე გაასუფთავებს ნიმუშს უმნიშვნელო ფაქტორებისგან. ასე რომ, თუ ხედავთ, რომ კოეფიციენტის მნიშვნელობა არის 0%, მაშინ დარწმუნებით განაცხადეთ, რომ სერია ერთგვაროვანია, რაც ნიშნავს, რომ მასში არსებული ყველა მნიშვნელობა უდრის ერთმანეთს. თუ ვარიაციის კოეფიციენტი იღებს 33%-ზე მეტ მნიშვნელობას, ეს მიუთითებს იმაზე, რომ საქმე გაქვთ ჰეტეროგენულ სერიასთან, რომელშიც ინდივიდუალური მნიშვნელობები მნიშვნელოვნად განსხვავდება ნიმუშის საშუალოდან.

როგორ მოვძებნოთ სტანდარტული გადახრა?

ვინაიდან Excel-ში ვარიაციის ინდექსის გამოსათვლელად საჭიროა გამოვიყენოთ სტანდარტული გადახრა, სავსებით მიზანშეწონილი იქნება იმის გარკვევა, თუ როგორ შეგვიძლია გამოვთვალოთ ეს პარამეტრი.

სკოლის ალგებრის კურსიდან ჩვენ ვიცით, რომ სტანდარტული გადახრა არის კვადრატული ფესვი, რომელიც ამოღებულია დისპერსიიდან, ანუ ეს მაჩვენებელი განსაზღვრავს ზოგადი ნიმუშის კონკრეტული ინდიკატორის გადახრის ხარისხს მისი საშუალო მნიშვნელობიდან. მისი დახმარებით ჩვენ შეგვიძლია გავზომოთ შესასწავლი მახასიათებლის რყევების აბსოლუტური ზომა და მკაფიოდ ინტერპრეტაცია მოვახდინოთ.

კოეფიციენტის გამოთვლა Excel-ში

სამწუხაროდ, Excel-ს არ აქვს სტანდარტული ფორმულა, რომელიც საშუალებას მოგცემთ ავტომატურად გამოთვალოთ ვარიაციის ინდექსი. მაგრამ ეს არ ნიშნავს იმას, რომ თქვენ უნდა გააკეთოთ გამოთვლები თქვენს თავში. შაბლონის არარსებობა "ფორმულა ზოლში" არანაირად არ აკნინებს Excel-ის შესაძლებლობებს, ასე რომ თქვენ შეგიძლიათ მარტივად აიძულოთ პროგრამა შეასრულოს თქვენთვის საჭირო გაანგარიშება შესაბამისი ბრძანების ხელით შეყვანით.

Excel-ში ვარიაციის ინდექსის გამოსათვლელად, უნდა გახსოვდეთ სკოლის კურსიმათემატიკა და გავყოთ სტანდარტული გადახრა შერჩევის საშუალოზე. ანუ, ფაქტობრივად, ფორმულა ასე გამოიყურება: STANDARDEVAL (განსაზღვრული მონაცემთა დიაპაზონი) / AVERAGE (განსაზღვრული მონაცემთა დიაპაზონი). თქვენ უნდა შეიყვანოთ ეს ფორმულა Excel უჯრედში, რომელშიც გსურთ მიიღოთ თქვენთვის საჭირო გაანგარიშება.

არ უნდა დაგვავიწყდეს, რომ ვინაიდან კოეფიციენტი გამოხატულია პროცენტულად, ფორმულის მქონე უჯრედი შესაბამისად უნდა იყოს ფორმატირებული. ამის გაკეთება შეგიძლიათ შემდეგნაირად:

გახსენით "მთავარი" ჩანართი.
იპოვეთ მასში "უჯრედის ფორმატის" კატეგორია და აირჩიეთ საჭირო ვარიანტი.

ალტერნატიულად, შეგიძლიათ დააყენოთ უჯრედის პროცენტული ფორმატი გააქტიურებულ ცხრილის უჯრედზე მაუსის მარჯვენა ღილაკით დაწკაპუნებით. კონტექსტურ მენიუში, რომელიც გამოჩნდება, ზემოთ მოყვანილი ალგორითმის მსგავსად, თქვენ უნდა აირჩიოთ კატეგორია „უჯრედის ფორმატი“ და დააყენოთ საჭირო მნიშვნელობა.

აირჩიეთ პროცენტი და, საჭიროების შემთხვევაში, შეიყვანეთ ათობითი ადგილების რაოდენობა

შესაძლოა, ზემოაღნიშნული ალგორითმი ზოგიერთისთვის რთული ჩანდეს. სინამდვილეში, კოეფიციენტის გამოთვლა ისეთივე მარტივია, როგორც ორის დამატება ნატურალური რიცხვები. მას შემდეგ რაც დაასრულებთ ამ ამოცანას Excel-ში, თქვენ აღარასოდეს დაუბრუნდებით ნოუთბუქის დამღლელი, რთული გადაწყვეტილებებს.

მაინც ვერ გააკეთებ მონაცემთა გაფანტვის ხარისხის თვისობრივ შედარებას? დაბნეული ხართ ნიმუშის ზომით? მაშინ ახლავე შეუდგეთ საქმეს და პრაქტიკაში დაეუფლეთ ყველა იმ თეორიულ მასალას, რაც ზემოთ იყო წარმოდგენილი! დაე სტატისტიკური ანალიზიდა პროგნოზის შემუშავება აღარ იწვევს თქვენში შიშს და ნეგატივს. დაზოგეთ თქვენი ენერგია და დრო

დისპერსია არის დისპერსიის საზომი, რომელიც აღწერს შედარებითი გადახრას მონაცემთა მნიშვნელობებსა და საშუალოს შორის. არის სტატისტიკაში დისპერსიის ყველაზე ხშირად გამოყენებული საზომი, რომელიც გამოითვლება შეჯამებით, კვადრატებით, თითოეული მონაცემთა მნიშვნელობის გადახრით. საშუალო ზომა. დისპერსიის გამოთვლის ფორმულა მოცემულია ქვემოთ:

s 2 – ნიმუშის განსხვავება;

x av — ნიმუშის საშუალო;

ნ — ნიმუშის ზომა (მონაცემთა მნიშვნელობების რაოდენობა),

(x i – x avg) არის გადახრა საშუალო მნიშვნელობიდან მონაცემთა ნაკრების თითოეული მნიშვნელობისთვის.

ფორმულის უკეთ გასაგებად, მოდით შევხედოთ მაგალითს. მე ნამდვილად არ მიყვარს სამზარეულო, ამიტომ იშვიათად ვაკეთებ. თუმცა, იმისთვის, რომ შიმშილი არ მომიწიოს, დროდადრო მიწევს ღუმელთან მისვლა, რათა განვახორციელო ჩემი ორგანიზმის ცილებით, ცხიმებითა და ნახშირწყლებით გაჯერების გეგმა. ქვემოთ მოცემული მონაცემები გვიჩვენებს, რამდენჯერ ამზადებს რენატი თვეში:

დისპერსიის გამოთვლის პირველი ნაბიჯი არის შერჩევის საშუალო განსაზღვრა, რომელიც ჩვენს მაგალითში არის 7.8 ჯერ თვეში. დანარჩენი გამოთვლები შეიძლება გაადვილდეს შემდეგი ცხრილის გამოყენებით.

დისპერსიის გამოთვლის საბოლოო ეტაპი ასე გამოიყურება:

მათთვის, ვისაც სურს ყველა გამოთვლა ერთჯერადად გააკეთოს, განტოლება ასე გამოიყურება:

ნედლეულის დათვლის მეთოდის გამოყენება (სამზარეულო მაგალითი)

არსებობს დისპერსიის გამოთვლის უფრო ეფექტური გზა, რომელიც ცნობილია როგორც ნედლეულის დათვლის მეთოდი. მიუხედავად იმისა, რომ განტოლება შეიძლება ერთი შეხედვით საკმაოდ რთული ჩანდეს, ის სინამდვილეში არც ისე საშინელია. შეგიძლიათ დარწმუნდეთ ამაში და შემდეგ გადაწყვიტეთ რომელი მეთოდი მოგწონთ საუკეთესოდ.

არის თითოეული მონაცემთა მნიშვნელობის ჯამი კვადრატის შემდეგ,

არის ყველა მონაცემის მნიშვნელობის ჯამის კვადრატი.

არ დაკარგო გონება ახლავე. მოდი ეს ყველაფერი ჩავწეროთ ცხრილში და ნახავთ, რომ აქ ნაკლები გამოთვლებია, ვიდრე წინა მაგალითში.

როგორც ხედავთ, შედეგი იგივე იყო, რაც წინა მეთოდის გამოყენებისას. ამ მეთოდის უპირატესობები აშკარა ხდება ნიმუშის ზომის (n) მატებასთან ერთად.

დისპერსიის გაანგარიშება Excel-ში

როგორც ალბათ უკვე მიხვდით, Excel-ს აქვს ფორმულა, რომელიც საშუალებას გაძლევთ გამოთვალოთ დისპერსიული. უფრო მეტიც, Excel 2010-დან დაწყებული, შეგიძლიათ იპოვოთ დისპერსიის ფორმულის 4 ტიპი:

1) VARIANCE.V – აბრუნებს ნიმუშის დისპერსიას. ლოგიკური მნიშვნელობები და ტექსტი იგნორირებულია.

2) DISP.G - აბრუნებს პოპულაციის დისპერსიას. ლოგიკური მნიშვნელობები და ტექსტი იგნორირებულია.

3) VARIANCE - აბრუნებს ნიმუშის დისპერსიას, ლოგიკური და ტექსტური მნიშვნელობების გათვალისწინებით.

4) VARIANCE - აბრუნებს პოპულაციის დისპერსიას ლოგიკური და ტექსტური მნიშვნელობების გათვალისწინებით.

პირველი, მოდით გავიგოთ განსხვავება ნიმუშსა და პოპულაციას შორის. აღწერითი სტატისტიკის მიზანია მონაცემების შეჯამება ან ჩვენება, რათა სწრაფად მიიღოთ დიდი სურათი, ასე ვთქვათ მიმოხილვა. სტატისტიკური დასკვნა საშუალებას გაძლევთ გააკეთოთ დასკვნები პოპულაციის შესახებ ამ პოპულაციის მონაცემების ნიმუშზე დაყრდნობით. პოპულაცია წარმოადგენს ყველა შესაძლო შედეგს ან გაზომვას, რომელიც ჩვენთვის საინტერესოა. ნიმუში არის პოპულაციის ქვეჯგუფი.

მაგალითად, ჩვენ გვაინტერესებს სტუდენტთა ჯგუფის მთლიანობა ერთ-ერთიდან რუსეთის უნივერსიტეტებიდა ჯგუფის საშუალო ქულა უნდა განვსაზღვროთ. ჩვენ შეგვიძლია გამოვთვალოთ სტუდენტების საშუალო მაჩვენებლები და შემდეგ მიღებული ფიგურა იქნება პარამეტრი, რადგან მთელი მოსახლეობა ჩართული იქნება ჩვენს გამოთვლებში. თუმცა, თუ გვინდა გამოვთვალოთ ჩვენი ქვეყნის ყველა სტუდენტის GPA, მაშინ ეს ჯგუფი იქნება ჩვენი ნიმუში.

განსხვავება ნიმუშსა და პოპულაციას შორის დისპერსიის გამოთვლის ფორმულაში არის მნიშვნელი. სადაც ნიმუშისთვის ის იქნება (n-1) ტოლი, ხოლო საერთო პოპულაციისთვის მხოლოდ n.

ახლა მოდით შევხედოთ დაბოლოებებთან დისპერსიის გამოთვლის ფუნქციებს A,რომლის აღწერილობაში ნათქვამია, რომ გაანგარიშება ითვალისწინებს ტექსტს და ლოგიკური მნიშვნელობები. ამ შემთხვევაში, გარკვეული მონაცემთა მასივის დისპერსიის გაანგარიშებისას, სადაც არ არის რიცხვითი მნიშვნელობები Excel ინტერპრეტაციას გაუკეთებს ტექსტს და ცრუ ლოგიკურ მნიშვნელობებს 0-ის ტოლი, ხოლო ჭეშმარიტი ლოგიკური მნიშვნელობები 1-ის ტოლი.

ასე რომ, თუ თქვენ გაქვთ მონაცემთა მასივი, მისი დისპერსიის გამოთვლა არ იქნება რთული ზემოთ ჩამოთვლილი Excel-ის ერთ-ერთი ფუნქციის გამოყენებით.

მოდით გამოვთვალოთMSEXCELნიმუშის ვარიაცია და სტანდარტული გადახრა. ჩვენ ასევე გამოვთვლით შემთხვევითი ცვლადის დისპერსიას, თუ ცნობილია მისი განაწილება.

ჯერ განვიხილოთ დისპერსიას, მაშინ სტანდარტული გადახრა.

ნიმუშის ვარიაცია

ნიმუშის ვარიაცია (ნიმუშის ვარიაცია,ნიმუშიდისპერსიას) ახასიათებს მნიშვნელობების გავრცელებას მასივში .

სამივე ფორმულა მათემატიკურად ექვივალენტურია.

პირველი ფორმულიდან ირკვევა, რომ ნიმუშის განსხვავებაარის მასივში თითოეული მნიშვნელობის კვადრატული გადახრების ჯამი საშუალოდან, გაყოფილი ნიმუშის ზომაზე მინუს 1.

განსხვავებები ნიმუშებიგამოიყენება DISP() ფუნქცია, ინგლისური. სახელი VAR, ე.ი. ვარიაცია. MS EXCEL 2010 ვერსიიდან რეკომენდირებულია გამოიყენოთ მისი ანალოგი DISP.V(), ინგლისური. სახელი VARS, ე.ი. ნიმუში VARiance. გარდა ამისა, MS EXCEL 2010 ვერსიიდან დაწყებული, არის ფუნქცია DISP.Г(), ინგლისური. სახელი VARP, ე.ი. პოპულაციის VARiance, რომელიც ითვლის დისპერსიასამისთვის მოსახლეობა. მთელი განსხვავება მოდის მნიშვნელზე: n-1-ის ნაცვლად, როგორიცაა DISP.V(), DISP.G()-ს აქვს მხოლოდ n მნიშვნელში. MS EXCEL 2010-მდე VAR() ფუნქცია გამოიყენებოდა პოპულაციის დისპერსიის გამოსათვლელად.

ნიმუშის ვარიაცია
=QUADROTCL(ნიმუში)/(COUNT(ნიმუში)-1)
=(SUM(ნიმუში)-COUNT(ნიმუში)*AVERAGE(ნიმუში)^2)/ (COUNT(ნიმუში)-1)- ჩვეულებრივი ფორმულა
=SUM((ნიმუში -AVERAGE(ნიმუში))^2)/ (COUNT(ნიმუში)-1) –

ნიმუშის ვარიაციაუდრის 0-ს, მხოლოდ იმ შემთხვევაში, თუ ყველა მნიშვნელობა ერთმანეთის ტოლია და, შესაბამისად, ტოლია საშუალო ღირებულება. ჩვეულებრივ, რაც უფრო დიდია მნიშვნელობა განსხვავებები, რაც უფრო დიდია მნიშვნელობების გავრცელება მასივში.

ნიმუშის ვარიაციაარის ქულების შეფასება განსხვავებებიშემთხვევითი ცვლადის განაწილება, საიდანაც იგი შეიქმნა ნიმუში. მშენებლობის შესახებ ნდობის ინტერვალებიშეფასებისას განსხვავებებიშეგიძლიათ წაიკითხოთ სტატიაში.

შემთხვევითი ცვლადის ვარიაცია

გამოთვლა დისპერსიასშემთხვევითი ცვლადი, თქვენ უნდა იცოდეთ იგი.

ამისთვის განსხვავებებიშემთხვევითი ცვლადი X ხშირად აღინიშნება Var(X). დისპერსია E(X) საშუალოდან გადახრის კვადრატის ტოლი: Var(X)=E[(X-E(X)) 2 ]

დისპერსიასგამოითვლება ფორმულით:

სადაც x i არის მნიშვნელობა, რომელიც შეიძლება მიიღოს შემთხვევითი ცვლადი, და μ არის საშუალო მნიშვნელობა (), p(x) არის ალბათობა იმისა, რომ შემთხვევითი ცვლადი მიიღებს x მნიშვნელობას.

თუ შემთხვევით ცვლადს აქვს , მაშინ დისპერსიასგამოითვლება ფორმულით:

განზომილება განსხვავებებიშეესაბამება საწყისი მნიშვნელობების საზომი ერთეულის კვადრატს. მაგალითად, თუ ნიმუშის მნიშვნელობები წარმოადგენს ნაწილის წონის გაზომვებს (კგ-ში), მაშინ დისპერსიის განზომილება იქნება კგ 2. ამის ინტერპრეტაცია შეიძლება რთული იყოს, ამიტომ ფასეულობების გავრცელების დასახასიათებლად ტოლფასი ღირებულებაა კვადრატული ფესვისაწყისი განსხვავებები – სტანდარტული გადახრა.

ზოგიერთი თვისება განსხვავებები:

Var(X+a)=Var(X), სადაც X არის შემთხვევითი ცვლადი და a არის მუდმივი.

Var(aХ)=a 2 Var(X)

ვარ(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

ეს დისპერსიული თვისება გამოიყენება სტატია ხაზოვანი რეგრესიის შესახებ.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), სადაც X და Y - შემთხვევითი ცვლადები, Cov(Х;Y) - ამ შემთხვევითი ცვლადების კოვარიანტობა.

თუ შემთხვევითი ცვლადები დამოუკიდებელია, მაშინ ისინი კოვარიანტობაუდრის 0-ს და ამიტომ Var(X+Y)=Var(X)+Var(Y). დისპერსიის ეს თვისება გამოიყენება დერივაციაში.

ვაჩვენოთ, რომ დამოუკიდებელი სიდიდეებისთვის Var(X-Y)=Var(X+Y). მართლაც, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). ეს დისპერსიული თვისება გამოიყენება ასაგებად.

სტანდარტული გადახრის ნიმუში

სტანდარტული გადახრის ნიმუშიარის საზომი იმისა, თუ რამდენად ფართოდ არის გაფანტული მნიშვნელობები ნიმუშში მათთან შედარებით.

განმარტებით, სტანდარტული გადახრაკვადრატული ფესვის ტოლი განსხვავებები:

სტანდარტული გადახრაარ ითვალისწინებს მნიშვნელობების სიდიდეს ნიმუში, მაგრამ მხოლოდ მათ გარშემო ფასეულობების დისპერსიის ხარისხი საშუალო. ამის საილუსტრაციოდ მოვიყვანოთ მაგალითი.

გამოვთვალოთ სტანდარტული გადახრა 2 ნიმუშისთვის: (1; 5; 9) და (1001; 1005; 1009). ორივე შემთხვევაში s=4. აშკარაა, რომ სტანდარტული გადახრის თანაფარდობა მასივის მნიშვნელობებთან მნიშვნელოვნად განსხვავდება ნიმუშებს შორის. ასეთი შემთხვევებისთვის გამოიყენება ვარიაციის კოეფიციენტი(ვარიაციის კოეფიციენტი, CV) - თანაფარდობა სტანდარტული გადახრასაშუალომდე არითმეტიკა, გამოხატული პროცენტულად.

MS EXCEL 2007-ში და უფრო ადრეულ ვერსიებში გამოსათვლელად სტანდარტული გადახრის ნიმუშიფუნქცია =STDEVAL() გამოიყენება, ინგლისური. დაასახელეთ STDEV, ე.ი. სტანდარტული გადახრა. MS EXCEL 2010 ვერსიიდან რეკომენდებულია მისი ანალოგი =STANDDEV.B() , ინგლისური. დაასახელეთ STDEV.S, ე.ი. სტანდარტული გადახრის ნიმუში.

გარდა ამისა, MS EXCEL 2010 ვერსიიდან დაწყებული, არსებობს ფუნქცია STANDARDEV.G(), ინგლისური. დაასახელეთ STDEV.P, ე.ი. პოპულაციის სტანდარტული გადახრა, რომელიც ითვლის სტანდარტული გადახრაამისთვის მოსახლეობა. მთელი განსხვავება მოდის მნიშვნელზე: n-1-ის ნაცვლად, როგორც STANDARDEV.V(), STANDARDEVAL.G() მნიშვნელში მხოლოდ n აქვს.

სტანდარტული გადახრაასევე შეიძლება გამოითვალოს პირდაპირ ქვემოთ მოცემული ფორმულების გამოყენებით (იხ. ფაილის მაგალითი)
=ROOT(QUADROTCL(ნიმუში)/(COUNT(ნიმუში)-1))
=ROOT((SUM(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/(COUNT(Sample)-1))

გაფანტვის სხვა ზომები

SQUADROTCL() ფუნქცია ითვლის მნიშვნელობების კვადრატული გადახრების ჯამი მათგან საშუალო. ეს ფუნქცია დააბრუნებს იგივე შედეგს, როგორც ფორმულა =DISP.G( ნიმუში)*შეამოწმეთ( ნიმუში), სად ნიმუში- მითითება დიაპაზონზე, რომელიც შეიცავს ნიმუშის მნიშვნელობების მასივს (). QUADROCL() ფუნქციაში გამოთვლები ხდება ფორმულის მიხედვით:

SROTCL() ფუნქცია ასევე არის მონაცემთა ნაკრების გავრცელების საზომი. ფუნქცია SROTCL() ითვლის მნიშვნელობების გადახრების აბსოლუტური მნიშვნელობების საშუალოს საშუალო. ეს ფუნქცია დააბრუნებს იგივე შედეგს, რასაც ფორმულა =SUMPRODUCT(ABS(Sample-AVERAGE(Sample)))/COUNT(Sample), სად ნიმუში- ბმული დიაპაზონთან, რომელიც შეიცავს ნიმუშის მნიშვნელობების მასივს.

SROTCL () ფუნქციაში გამოთვლები ხდება ფორმულის მიხედვით: