Регрессиялық талдау – кездейсоқ шаманың айнымалыларға тәуелділігін зерттеуге арналған статистикалық әдіс. Мәліметтерді талдау негіздері Регрессиялық тәуелділік

Регрессиялық талдаудың негізгі ерекшелігі: оның көмегімен зерттелетін айнымалылар арасындағы байланыс қандай форма мен сипатта болатыны туралы нақты ақпарат алуға болады.

Регрессиялық талдау кезеңдерінің реттілігі

Регрессиялық талдаудың кезеңдерін қысқаша қарастырайық.

    Мәселені құрастыру. Бұл кезеңде зерттелетін құбылыстардың тәуелділігі туралы алдын ала гипотезалар қалыптасады.

    Тәуелді және тәуелсіз (түсіндірмелі) айнымалылардың анықтамасы.

    Статистикалық мәліметтерді жинау. Деректер регрессия үлгісіне енгізілген айнымалылардың әрқайсысы үшін жиналуы керек.

    Байланыс формасы туралы гипотезаны тұжырымдау (жай немесе көптік, сызықтық немесе сызықтық емес).

    Анықтама регрессия функциялары (регрессия теңдеуінің параметрлерінің сандық мәндерін есептеуден тұрады)

    Регрессиялық талдаудың дәлдігін бағалау.

    Алынған нәтижелерді интерпретациялау. Регрессиялық талдаудың алынған нәтижелері алдын ала болжаммен салыстырылады. Алынған нәтижелердің дұрыстығы мен сенімділігі бағаланады.

    Тәуелді айнымалының белгісіз мәндерін болжау.

Регрессиялық талдауды қолдана отырып, болжау және жіктеу мәселесін шешуге болады. Болжамды мәндер регрессия теңдеуіне түсіндірме айнымалылардың мәндерін ауыстыру арқылы есептеледі. Жіктеу мәселесі осылай шешіледі: регрессия сызығы объектілердің барлық жиынын екі класқа бөледі, ал жиынның функция мәні нөлден үлкен бөлігі бір классқа жатады, ал нөлден кіші бөлігі. басқа сыныпқа жатады.

Регрессиялық талдау мәселелері

Регрессиялық талдаудың негізгі міндеттерін қарастырайық: тәуелділік формасын орнату, анықтау регрессия функциялары, тәуелді айнымалының белгісіз мәндерін бағалау.

Тәуелділік формасын белгілеу.

Айнымалылар арасындағы қатынастың сипаты мен формасы регрессияның келесі түрлерін құра алады:

    оң сызықтық регрессия (функцияның біркелкі өсуімен өрнектеледі);

    оң біркелкі өсетін регрессия;

    оң біркелкі өсетін регрессия;

    теріс сызықтық регрессия (функцияның біркелкі төмендеуі ретінде көрсетіледі);

    теріс біркелкі жеделдетілген төмендейтін регрессия;

    теріс біркелкі төмендейтін регрессия.

Дегенмен, сипатталған сорттар әдетте табылмайды таза пішін, бірақ бір-бірімен үйлеседі. Бұл жағдайда біз регрессияның біріктірілген формалары туралы айтамыз.

Регрессия функциясының анықтамасы.

Екінші тапсырма негізгі факторлардың немесе себептердің тәуелді айнымалыға әсерін анықтауға келеді, басқа барлық нәрселер тең және тәуелді шамаға кездейсоқ элементтердің әсерін алып тастау шартымен. Регрессия функциясысол немесе басқа түрдегі математикалық теңдеу түрінде анықталады.

Тәуелді айнымалының белгісіз мәндерін бағалау.

Бұл мәселені шешу келесі түрлердің біріндегі мәселені шешуге келеді:

    Бастапқы деректердің қарастырылатын интервалында тәуелді айнымалы мәндерін бағалау, яғни. жетіспейтін мәндер; бұл жағдайда интерполяция мәселесі шешіледі.

    Тәуелді айнымалының болашақ мәндерін бағалау, яғни. бастапқы деректердің көрсетілген интервалынан тыс мәндерді табу; бұл жағдайда экстраполяция мәселесі шешіледі.

Екі мәселе де регрессия теңдеуіне тәуелсіз айнымалылардың мәндері үшін табылған параметрлік бағалауларды ауыстыру арқылы шешіледі. Теңдеуді шешудің нәтижесі мақсатты (тәуелді) айнымалының мәнін бағалау болып табылады.

Регрессиялық талдау сүйенетін кейбір болжамдарды қарастырайық.

Сызықтық болжам, яғни. қарастырылып отырған айнымалылар арасындағы байланыс сызықтық деп қабылданады. Сонымен, бұл мысалда біз шашырау сызбасын құрдық және нақты сызықтық қатынасты көре алдық. Егер айнымалылардың шашырау диаграммасында сызықтық байланыстың анық жоқтығын көреміз, яғни. Егер сызықтық емес байланыс болса, сызықтық емес талдау әдістерін қолдану керек.

Қалыптылық болжамы қалдықтары. Ол болжанған және бақыланатын мәндер арасындағы айырмашылықтың таралуы қалыпты деп болжайды. Бөлу сипатын көрнекі түрде анықтау үшін гистограммаларды пайдалануға болады қалдықтары.

Регрессиялық талдауды қолдану кезінде оның негізгі шектеуін ескеру қажет. Ол регрессиялық талдау осы тәуелділіктердің негізінде жатқан байланыстарды емес, тек тәуелділіктерді анықтауға мүмкіндік беретінінен тұрады.

Регрессиялық талдау бірнеше белгілі мәндер негізінде айнымалының болжалды мәнін есептеу арқылы айнымалылар арасындағы байланыстың күшін бағалауға мүмкіндік береді.

Регрессия теңдеуі.

Регрессия теңдеуі келесідей көрінеді: Y=a+b*X

Бұл теңдеуді пайдалана отырып, Y айнымалысы тұрақты а және сызықтың (немесе көлбеу) b көлбеуі X айнымалысының мәніне көбейтінді арқылы өрнектеледі. a тұрақтысы кесінді мүшесі деп те аталады, ал еңіс - регрессия коэффициенті немесе В-коэффиценті.

Көп жағдайда (әрдайым болмаса) регрессия сызығына қатысты бақылаулардың белгілі бір шашырауы болады.

Қалдық бір нүктенің (бақылаудың) регрессия сызығынан (болжамдық мән) ауытқуы болып табылады.

MS Excel бағдарламасында регрессиялық талдау мәселесін шешу үшін мәзірден таңдау керек Қызмет«Талдау пакеті»және регрессиялық талдау құралы. X және Y енгізу интервалдарын орнатамыз. Y енгізу интервалы - тәуелді талданатын деректер ауқымы, ол бір бағанды ​​қамтуы керек. X енгізу интервалы талдауды қажет ететін тәуелсіз деректер ауқымы болып табылады. Енгізу ауқымдарының саны 16-дан аспауы керек.

Шығару диапазонындағы процедураның шығысында біз берілген есепті аламыз 8.3а кесте-8,3в.

НӘТИЖЕЛЕРДІ ҚОРЫТЫНДЫ

8.3а-кесте. Регрессия статистикасы

Регрессия статистикасы

Көпше R

R-шаршы

Нормаланған R-квадрат

Стандартты қате

Бақылаулар

Алдымен ұсынылған есептеулердің жоғарғы бөлігін қарастырайық 8.3а кесте, - регрессия статистикасы.

Магнитудасы R-шаршы, сондай-ақ сенімділік өлшемі деп аталады, нәтижесінде регрессия сызығының сапасын сипаттайды. Бұл сапа бастапқы деректер мен регрессиялық модель (есептелген деректер) арасындағы сәйкестік дәрежесімен көрінеді. Сенімділік өлшемі әрқашан интервалда болады.

Көп жағдайда мән R-шаршыэкстремалды деп аталатын осы мәндердің арасында болады, яғни. нөл мен бір арасында.

Мән болса R-шаршыбірлікке жақын, бұл құрастырылған модель сәйкес айнымалылардағы барлық дерлік өзгергіштікті түсіндіретінін білдіреді. Керісінше, мағынасы R-шаршы, нөлге жақын, құрастырылған үлгінің сапасыздығын білдіреді.

Біздің мысалда сенімділік өлшемі 0,99673 болып табылады, бұл регрессия сызығының бастапқы деректерге өте жақсы сәйкестігін көрсетеді.

көпше Р - еселік корреляция коэффициенті R - тәуелсіз айнымалылардың (Х) және тәуелді айнымалының (Y) тәуелділік дәрежесін білдіреді.

Көпше Rтең шаршы түбірдетерминация коэффициентінен бұл шама нөлден бірге дейінгі аралықтағы мәндерді қабылдайды.

Қарапайым сызықтық регрессиялық талдауда көпше РПирсон корреляция коэффициентіне тең. Шынымен, көпше Рбіздің жағдайда ол алдыңғы мысалдағы (0,998364) Пирсон корреляция коэффициентіне тең.

Кесте 8.3b. Регрессия коэффициенттері

Мүмкіндіктер

Стандартты қате

t-статистикалық

Y-қиылысы

Айнымалы X 1

* Есептеулердің қысқартылған нұсқасы берілген

Енді берілген есептеулердің ортаңғы бөлігін қарастырыңыз кесте 8.3b. Мұнда регрессия коэффициенті b (2,305454545) және ордината осі бойынша орын ауыстыру берілген, яғни. тұрақты a (2,694545455).

Есептеулер негізінде регрессия теңдеуін келесі түрде жазуға болады:

Y= x*2,305454545+2,694545455

Айнымалылар арасындағы байланыстың бағыты регрессия коэффициенттерінің (б коэффициенті) белгілеріне (теріс немесе оң) қарай анықталады.

Егер регрессия коэффициентінің таңбасы оң болса, тәуелді айнымалы мен тәуелсіз айнымалы арасындағы байланыс оң болады. Біздің жағдайда регрессия коэффицентінің таңбасы оң, демек, байланыс та оң болады.

Егер регрессия коэффициентінің таңбасы теріс болса, тәуелді айнымалы мен тәуелсіз айнымалы арасындағы байланыс теріс (кері) болады.

IN кесте 8.3c. шығару нәтижелері берілген қалдықтары. Бұл нәтижелер есепте пайда болуы үшін «Регрессия» құралын іске қосқан кезде «Қалдықтар» құсбелгісін қосу керек.

ҚАЛҒАНЫН АЛУ

Кесте 8.3c. Қалдықтар

Бақылау

Болжалды Ю

Қалдықтар

Стандартты баланстар

Есептің осы бөлігін пайдалана отырып, біз әрбір нүктенің құрастырылған регрессия сызығынан ауытқуын көре аламыз. Ең үлкен абсолютті мән қалдықбіздің жағдайда – 0,778, ең кішісі – 0,043. Бұл деректерді жақсырақ түсіндіру үшін біз бастапқы деректердің графигін және ұсынылған регрессия сызығын қолданамыз күріш. 8.3. Көріп отырғаныңыздай, регрессия сызығы бастапқы деректердің мәндеріне өте дәл «қондырылған».

Қарастырылып отырған мысал өте қарапайым және сызықтық регрессия сызығын сапалы тұрғызу әрқашан мүмкін емес екенін ескеру қажет.

Күріш. 8.3.Бастапқы деректер және регрессия сызығы

Тәуелсіз айнымалының белгілі мәндеріне негізделген тәуелді айнымалының белгісіз болашақ мәндерін бағалау мәселесі қарастырылмаған күйінде қалды, яғни. болжау мәселесі.

Регрессия теңдеуіне ие бола отырып, болжау мәселесі x белгілі мәндері бар Y= x*2,305454545+2,694545455 теңдеуін шешуге келтіріледі. Y тәуелді айнымалысын алты қадам алға болжау нәтижелері берілген 8.4 кестеде.

8.4-кесте. Y айнымалы болжам нәтижелері

Y(болжалды)

Осылайша, Microsoft Excel бағдарламасында регрессиялық талдауды қолдану нәтижесінде біз:

    регрессия теңдеуін құрастыру;

    қатынас формасы мен айнымалылар арасындағы байланыстың бағыты белгіленді – функцияның біркелкі өсуінде көрінетін оң сызықтық регрессия;

    айнымалылар арасындағы байланыстың бағытын белгіледі;

    алынған регрессия сызығының сапасын бағалады;

    есептелген мәліметтердің бастапқы жиынтық деректерінен ауытқуын көре алды;

    тәуелді айнымалының болжамды болашақ мәндері.

Егер регрессия функциясыанықталған, түсіндірілетін және негізделген, ал регрессиялық талдаудың дәлдігін бағалау талаптарға сәйкес келеді, құрастырылған модель және болжамды мәндер жеткілікті сенімділікке ие деп санауға болады.

Осылайша алынған болжамды мәндер күтуге болатын орташа мәндер болып табылады.

Бұл жұмыста біз негізгі сипаттамаларды қарастырдық сипаттамалық статистикажәне олардың арасында сияқты ұғымдар орташа мән,медиана,максимум,минимумжәне деректердің вариациясының басқа сипаттамалары.

Тұжырымдама да қысқаша талқыланды шығарындылар. Қарастырылған сипаттамалар зерттеуші деректер талдауына жатады, оның қорытындылары жалпы жиынтыққа емес, тек деректер үлгісіне қатысты болуы мүмкін; Барлау деректерін талдау бастапқы қорытындыларды алу және популяция туралы гипотезаларды қалыптастыру үшін қолданылады.

Корреляциялық және регрессиялық талдаудың негіздері, олардың міндеттері мен практикалық қолдану мүмкіндіктері де талқыланды.

1. «Регрессия» терминін алғаш рет биометриканың негізін салушы Ф.Гальтон (19 ғ.) енгізді, оның идеяларын оның ізбасары К.Пирсон дамытты.

Регрессиялық талдау - әдіс статистикалық өңдеубір немесе бірнеше себептер (факторлық сипаттамалар) мен салдар (нәтижелік сипаттама) арасындағы байланысты өлшеуге мүмкіндік беретін деректер.

Қол қою- бұл зерттелетін құбылыстың немесе процестің негізгі айырым белгісі, белгісі.

Тиімді белгі -зерттелетін көрсеткіш.

Фактор белгісі- нәтижелі сипаттаманың мәніне әсер ететін көрсеткіш.

Регрессиялық талдаудың мақсаты – алынған сипаттаманың орташа мәнінің функционалдық тәуелділігін бағалау ( сағ) факторынан ( x 1, x 2, …, x n), ретінде өрнектеледі регрессия теңдеулері

сағ= f(x 1, x 2, …, x n). (6.1)

Регрессияның екі түрі бар: жұптық және көптік.

Жұпталған (қарапайым) регрессия- түрдегі теңдеу:

сағ= f(x). (6.2)

Жұптық регрессиядағы нәтиже бір аргументтің функциясы ретінде қарастырылады, яғни. бір факторға тән.

Регрессиялық талдау келесі қадамдарды қамтиды:

· функцияның түрін анықтау;

· регрессия коэффициенттерін анықтау;

· алынған сипаттаманың теориялық мәндерін есептеу;

· регрессия коэффициенттерінің статистикалық маңыздылығын тексеру;

· регрессия теңдеуінің статистикалық маңыздылығын тексеру.

Көптік регрессия- түрдегі теңдеу:

сағ= f(x 1, x 2, …, x n). (6.3)

Алынған атрибут бірнеше аргументтердің функциясы ретінде қарастырылады, яғни. көптеген факторлардың белгілері.

2. Функцияның түрін дұрыс анықтау үшін теориялық мәліметтерге сүйене отырып, байланыс бағытын табу керек.

Байланыс бағыты бойынша регрессия келесіге бөлінеді:

· тікелей регрессиятәуелсіз санның ұлғаюы немесе азаюы жағдайында туындайтын " X"тәуелді шаманың мәндері» у"сондай-ақ сәйкесінше ұлғайту немесе азайту;

· кері регрессиятәуелсіз мәннің ұлғаюы немесе төмендеуі жағдайында туындайтын "X"тәуелді мөлшер» у"сәйкес азаяды немесе артады.

Қарым-қатынастарды сипаттау үшін жұпталған регрессия теңдеулерінің келесі түрлері қолданылады:

· y=a+bxсызықтық;

· y=e ax + b – экспоненциалды;

· y=a+b/x – гиперболалық;

· y=a+b 1 x+b 2 x 2 – параболалық;

· y=ab x – экспоненциалдыт.б.

Қайда a, b 1, b 2- теңдеудің коэффициенттері (параметрлері); сағ- тиімді белгі; X- фактор белгісі.

3. Регрессия теңдеуін құру оның коэффициенттерін (параметрлерін) бағалауға түседі, ол үшін біз пайдаланамыз ең кіші квадраттар әдісі(MNC).

Ең кіші квадраттар әдісі нәтиже атрибутының нақты мәндерінің квадраттық ауытқуларының қосындысы болатын параметрлерді бағалауға мүмкіндік береді. сағ«теориялықтан» y x» минималды, яғни

Регрессия теңдеуінің параметрлері y=a+bхЕң кіші квадраттар әдісімен формулалар арқылы бағаланады:

Қайда A -еркін коэффициент, б- регрессия коэффициенті нәтиже белгісінің қаншалықты өзгеретінін көрсетеді. ж«фактор сипаттамасы өзгергенде» x» өлшем бірлігіне.

4. Регрессия коэффициенттерінің статистикалық маңыздылығын бағалау үшін Стьюденттің t-тесті қолданылады.

Регрессия коэффициенттерінің маңыздылығын тексеру схемасы:

1) H 0: a=0, б=0 - регрессия коэффициенттері нөлден айтарлықтай айырмашылығы жоқ.

H 1: a≠ 0, b≠ 0 - регрессия коэффициенттері нөлден айтарлықтай ерекшеленеді.

2) r=0,05 – маңыздылық деңгейі.

Қайда м б,м а- кездейсоқ қателер:

; . (6.7)

4) t кесте(p; f),

Қайда f=n-k- 1 - еркіндік дәрежесінің саны ( кестенің мәні), n- бақылаулар саны, к X".

5) Егер , онда ол қабылданбады, яғни. коэффициенті маңызды.

Егер , онда ол қабылданады, яғни. коэффициенті шамалы.

5. Құрылған регрессия теңдеуінің дұрыстығын тексеру үшін Фишер критерийі қолданылады.

Регрессия теңдеуінің маңыздылығын тексеру схемасы:

1) H 0:Регрессия теңдеуі маңызды емес.

H 1:Регрессия теңдеуі маңызды.

2) r=0,05 – маңыздылық деңгейі.

3) , (6.8)

бақылаулар саны қайда; к- айнымалылары бар теңдеудегі параметрлер саны » X"; сағ- нәтижелік атрибуттың нақты мәні; y x- теориялық құндылығынәтиже белгісі; - жұптық корреляция коэффициенті.

4) F кестесі(p; f 1 ; f 2),

Қайда f 1 =k, f 2 =n-k-1-еркіндік дәрежелерінің саны (кестелік мәндер).

5) Егер F есептелген >F кестесі, онда регрессия теңдеуі дұрыс таңдалады және оны тәжірибеде қолдануға болады.

Егер F есептеу , онда регрессия теңдеуі дұрыс таңдалмаған.

6. Регрессиялық талдаудың сапасын көрсететін негізгі көрсеткіш болып табылады детерминация коэффициенті (R 2).

Анықтау коэффициентітәуелді айнымалының қандай үлесін көрсетеді» сағ« талдауда ескеріледі және оған талдауға енгізілген факторлардың әсерінен туындайды.

Анықтау коэффициенті (R 2)аралықтағы мәндерді қабылдайды. Регрессия теңдеуі сапалы, егер R 2 ≥0,8.

Детерминация коэффициенті корреляция коэффициентінің квадратына тең, яғни.

6.1-мысал.Төмендегі мәліметтерді пайдаланып регрессия теңдеуін құрыңыз және талдаңыз:

Шешім.

1) Корреляция коэффициентін есептеңіз: . Белгілер арасындағы байланыс тікелей және қалыпты.

2) Жұпталған сызықтық регрессия теңдеуін құрыңыз.

2.1) Есептеу кестесін құру.

X сағ Ху x 2 y x (ж-ж х) 2
55,89 47,54 65,70
45,07 15,42 222,83
54,85 34,19 8,11
51,36 5,55 11,27
42,28 45,16 13,84
47,69 1,71 44,77
45,86 9,87 192,05
сомасы 159,45 558,55
Орташа 77519,6 22,78 79,79 2990,6

,

Жұпталған сызықтық регрессия теңдеуі: y x =25,17+0,087x.

3) Теориялық мәндерді табыңыз» y x«регрессия теңдеуіне нақты мәндерді ауыстыру арқылы» X».

4) «Нақтының графиктерін құру» у"және теориялық құндылықтар» y x«тиімді сипаттама (6.1-сурет):r xy =0,47) және бақылаулардың аз саны.

7) Детерминация коэффициентін есептеңіз: R 2=(0,47) 2 =0,22. Құрылған теңдеу сапасыз.

Өйткені регрессиялық талдауды орындау кезінде есептеулер өте кең, арнайы бағдарламаларды пайдалану ұсынылады (Statistica 10, SPSS және т.б.).

6.2-суретте Statistica 10 бағдарламасы арқылы жүргізілген регрессиялық талдау нәтижелері көрсетілген кесте көрсетілген.

6.2-сурет. Statistica 10 бағдарламасы арқылы жүргізілген регрессиялық талдау нәтижелері

5. Әдебиет:

1. Гмурман В.Е. Ықтималдықтар теориясы және математикалық статистика: Оқу құралы. университеттерге арналған оқу құралы / В.Е. Гмурман. – М.: Жоғары мектеп, 2003. – 479 б.

2. Қойчубеков Б.Қ. Биостатистика: Оқулық. – Алматы: Эверо, 2014. – 154 б.

3. Лоботская Н.Л. Жоғары математика. / Н.Л. Лоботская, Ю.В. Морозов, А.А. Дунаев. – Мн.: Жоғары мектеп, 1987. – 319 б.

4. Дәрігер В.А., Токмачев М.С., Балықшы Б.Б. Медицина және биологиядағы статистика: нұсқаулық. 2 томда / Ред. Ю.М. Комарова. T. 1. Теориялық статистика. – М.: Медицина, 2000. – 412 б.

5. Қоғамдық денсаулықты және денсаулық сақтауды зерттеу үшін статистикалық талдау әдістерін қолдану: оқу құралы / ред. Кучеренко В.З. - 4-ші басылым, қайта қаралған. және қосымша – М.: ГЕОТАР - Медиа, 2011. - 256 б.

4-тараудағы материалды оқу нәтижесінде студент:

білу

  • регрессиялық талдаудың негізгі түсініктерін;
  • бағалау әдістері мен ең кіші квадраттарды бағалаудың қасиеттері;
  • теңдеулер мен регрессия коэффициенттерінің маңыздылығын және интервалдық бағасын тексерудің негізгі ережелерін;

білу

  • екі өлшемді және көп регрессиялық теңдеу модельдерінің параметрлерінің бағалауын табу және олардың қасиеттерін талдау үшін іріктеме мәліметтерін пайдалану;
  • теңдеудің маңыздылығын және регрессия коэффициенттерін тексеру;
  • маңызды параметрлердің интервалдық бағалауларын табу;

меншік

  • екі айнымалы және еселік регрессиялық теңдеулердің параметрлерін статистикалық бағалау дағдылары; регрессиялық модельдердің сәйкестігін тексеру дағдылары;
  • аналитикалық бағдарламалық қамтамасыз етуді пайдалана отырып, барлық маңызды коэффициенттері бар регрессия теңдеуін алу дағдылары.

Негізгі ұғымдар

Корреляциялық талдауды жүргізгеннен кейін айнымалылар арасында статистикалық маңызды байланыстардың болуы анықталғанда және олардың жақындық дәрежесі бағаланса, олар әдетте регрессиялық талдау әдістерін пайдалана отырып, тәуелділіктер түрін математикалық сипаттауға көшеді. Осы мақсатта тиімді көрсеткішке қатысты функциялар класы таңдалады сағжәне аргументтер„ біріктіру теңдеуінің параметрлерін бағалауды есептейді және алынған теңдеудің дәлдігін талдайды.

Функция|, нәтижелі сипаттаманың шартты орташа мәніне тәуелділігін сипаттайды сағберілген аргументтен мәндер шақырылады регрессия теңдеуі.

«Регрессия» термині (лат. регрессия –шегіну, бір нәрсеге оралу) ағылшын психологы және антропологы Ф.Гальтон енгізген және оның алғашқы мысалдарының бірімен байланысты, онда Гальтон бойдың тұқымқуалаушылық мәселесіне қатысты статистикалық мәліметтерді өңдей отырып, егер бойдың биіктігі болса әкелер барлық әкелердің орташа бойынан ауытқиды Xдюйм болса, онда олардың ұлдарының бойы барлық ұлдарының орташа бойынан азырақ ауытқиды xдюйм. Анықталған тренд деп аталды орташаға регрессия.

«Регрессия» термині статистикалық әдебиеттерде кеңінен қолданылады, дегенмен ол көп жағдайда статистикалық қатынасты дәл сипаттамайды.

Регрессия теңдеуін дәл сипаттау үшін тиімді көрсеткіштің шартты таралу заңын білу қажет u.Статистикалық тәжірибеде әдетте мұндай ақпаратты алу мүмкін емес, сондықтан олар функция үшін қолайлы жуықтауларды іздеумен шектеледі. f(x u X 2,... l*), құбылысты алдын ала мағыналы талдауға немесе бастапқы статистикалық мәліметтерге негізделген.

Көрсеткіштер векторының таралу түрі туралы жеке үлгі болжамдары шеңберінде<) может быть получен общий вид регрессия теңдеулері, Қайда. Мысалы, зерттелетін көрсеткіштер жиынтығы математикалық күтулер векторы бар () өлшемді қалыпты таралу заңына бағынады деген болжам бойынша

Мұндағы және коварианттық матрицасы,

дисперсия қайда у,

Регрессия теңдеуі (шартты математикалық күту) нысаны бар

Осылайша, егер көп айнымалы кездейсоқ шама ()

()-өлшемді қалыпты таралу заңына, содан кейін тиімді көрсеткіштің регрессия теңдеуіне бағынады сағТүсіндірме айнымалыларда сызықтық Xкөрініс.

Дегенмен, статистикалық тәжірибеде әдетте белгісіз шынайы регрессия функциясы үшін қолайлы жуықтауларды табумен шектелуге тура келеді. f(x),өйткені зерттеушінің талданатын тиімділік көрсеткішінің шартты ықтималдықты бөлу заңы туралы нақты білімі жоқ сағберілген аргумент мәндері үшін X.

Ақиқат, үлгі және регрессиялық бағалаулар арасындағы байланысты қарастырайық. Тиімді көрсеткіш болсын сағаргументпен байланысты Xқатынасы

мұндағы қалыпты таралу заңы бар кездейсоқ шама, және. Бұл жағдайда шынайы регрессия функциясының пішіні бар

Шынайы регрессия теңдеуінің нақты түрі бізге белгісіз делік, бірақ бізде екі өлшемді кездейсоқ шаманың тоғыз бақылауы бар, суретте көрсетілген қатынастармен байланысты. 4.1.

Күріш. 4.1. Шындықтың салыстырмалы орныf(x) және теориялықойрегрессия модельдері

Суреттегі нүктелердің орналасуы. 4.1 пішіннің сызықтық тәуелділік класымен шектелуге мүмкіндік береді

Ең кіші квадраттар әдісін қолданып, регрессия теңдеуінің бағасын табамыз.

Салыстыру үшін, суретте. 4.1 шынайы регрессия функциясының және теориялық жуықтау регрессия функциясының графиктерін көрсетеді. Регрессия теңдеуінің бағасы ықтималдық бойынша соңғысына жақындайды ойіріктеу көлемінің шексіз ұлғаюымен ().

Өкінішке орай, статистикалық зерттеу тәжірибесінде жиі кездесетін шынайы регрессия функциясының орнына сызықтық регрессия функциясын қате таңдағандықтан, біздің статистикалық қорытындыларымыз бен бағалауларымыз дәйектілік қасиетіне ие болмайды, яғни. Бақылаулар санын қалай көбейткенімізге қарамастан, біздің таңдамалы бағалауымыз шынайы регрессия функциясына жақындамайды.

Егер біз регрессиялық функциялар класын дұрыс таңдаған болсақ, онда пайдалану сипаттамадағы дәлсіздік ойшектелген іріктеумен ғана түсіндіріледі, сондықтан оны қалағандай аз етіп жасауға болады

Бастапқы статистикалық деректерден өнімділік көрсеткішінің шартты мәнін және белгісіз регрессия функциясын ең жақсы қалпына келтіру үшін келесілер жиі қолданылады: сәйкестік критерийлеріжоғалту функциялары.

1. Ең кіші квадраттар әдісі,оған сәйкес тиімді индикатордың байқалған мәндерінің квадраттық ауытқуы, , модель мәндерінен минимумға дейін төмендетіледі, мұнда регрессия теңдеуінің коэффициенттері «-M бақылау:

Вектордың бағасын табу мәселесі шешілді. Алынған регрессия деп аталады орташа квадрат.

2. Ең кіші модульдер әдісі, оған сәйкес модульдік мәндерден тиімді индикатордың байқалған мәндерінің абсолютті ауытқуларының қосындысы барынша азайтылады, яғни.

Алынған регрессия деп аталады абсолютті білдіреді(медиана).

3. Минимакс әдісітиімді индикатордың байқалатын шамасының максималды ауытқу модулін минимумға келтіруге келеді у,үлгі мәнінен, яғни.

Алынған регрессия деп аталады минимакс.

Практикалық қолданбаларда кездейсоқ шама зерттелетін мәселелер жиі кездеседі у,белгілі бір айнымалылар жиынына және белгісіз параметрлерге байланысты. () ретінде қарастырамыз (k + 1)-кездейсоқ таңдап алынған өлшемді жалпы жиынтық p,мұндағы () - i-ші бақылаудың нәтижесі. Бақылау нәтижелері бойынша белгісіз параметрлерді бағалау қажет. Жоғарыда сипатталған тапсырма регрессиялық талдау мәселелеріне қатысты.

Регрессиялық талдау кездейсоқ шаманың тәуелділігін статистикалық талдау әдісі деп аталады сағшынайы таралу заңына қарамастан, кездейсоқ емес мәндер ретінде регрессиялық талдауда қарастырылатын айнымалылар бойынша

Оқу барысында студенттер әртүрлі теңдеулерді жиі кездестіреді. Олардың бірі – регрессия теңдеуі – осы мақалада қарастырылады. Теңдеудің бұл түрі математикалық параметрлер арасындағы байланыстың сипаттамаларын сипаттау үшін арнайы қолданылады. Теңдіктің бұл түрі статистика мен эконометрикада қолданылады.

Регрессия анықтамасы

Математикада регрессия деректер жиынының орташа мәнінің басқа шаманың мәндеріне тәуелділігін сипаттайтын белгілі бір шаманы білдіреді. Регрессия теңдеуі белгілі бір сипаттаманың функциясы ретінде басқа сипаттаманың орташа мәнін көрсетеді. Регрессия функциясы y = x қарапайым теңдеу түрінде болады, онда y тәуелді айнымалы, ал х тәуелсіз айнымалы (ерекшелік-фактор) ретінде әрекет етеді. Іс жүзінде регрессия y = f (x) түрінде өрнектеледі.

Айнымалылар арасындағы байланыстың қандай түрлері бар?

Жалпы алғанда, қарым-қатынастардың екі қарама-қарсы түрі бар: корреляция және регрессия.

Біріншісі шартты айнымалылардың теңдігімен сипатталады. Бұл жағдайда қай айнымалының екіншісіне тәуелді екені анық белгісіз.

Егер айнымалылар арасында теңдік болмаса және шарттар қай айнымалының түсіндірмелі, қайсысы тәуелді екенін айтса, онда екінші типті байланыстың болуы туралы айтуға болады. Сызықтық регрессия теңдеуін құру үшін байланыстардың қандай түрі байқалатынын анықтау қажет болады.

Регрессия түрлері

Бүгінгі таңда регрессияның 7 түрі бар: гиперболалық, сызықтық, еселік, сызықтық емес, жұптық, кері, логарифмдік сызықтық.

Гиперболалық, сызықтық және логарифмдік

Сызықтық регрессия теңдеуі статистикада теңдеудің параметрлерін нақты түсіндіру үшін қолданылады. y = c+t*x+E сияқты көрінеді. Гиперболалық теңдеу y = c + m / x + E тұрақты гипербола түрінде болады. Логарифмдік сызықтық теңдеу логарифмдік функцияны пайдаланып қатынасты өрнектейді: у = в с + m * в х + Е.

Көптік және сызықтық емес

Регрессияның екі күрделі түрі көп және сызықты емес. Көптік регрессия теңдеуі y = f(x 1, x 2 ...x c)+E функциясымен өрнектеледі. Бұл жағдайда у тәуелді айнымалы, ал х түсіндірме айнымалы ретінде әрекет етеді. E айнымалысы стохастикалық болып табылады, ол теңдеудегі басқа факторлардың әсерін қамтиды. Сызықты емес регрессия теңдеуі аздап даулы. Бір жағынан, есепке алынған көрсеткіштерге қатысты, ол сызықтық емес, екінші жағынан, көрсеткіштерді бағалау рөлінде сызықтық болып табылады.

Регрессиялардың кері және жұптық түрлері

Кері функция сызықтық түрге түрлендіруді қажет ететін функция түрі болып табылады. Ең дәстүрлі қолданбалы бағдарламаларда ол y = 1/c + m*x+E функциясының пішініне ие. Жұптық регрессия теңдеуі y = f (x) + E функциясы ретінде деректер арасындағы байланысты көрсетеді. Басқа теңдеулердегі сияқты, у х-ке тәуелді, ал E - стохастикалық параметр.

Корреляция туралы түсінік

Бұл екі құбылыс немесе процесс арасындағы байланыстың бар екендігін көрсететін көрсеткіш. Қарым-қатынастың күші корреляция коэффициенті ретінде көрсетіледі. Оның мәні [-1;+1] интервалында ауытқиды. Теріс көрсеткіш кері байланыстың болуын көрсетеді, оң көрсеткіш тікелей кері байланысты көрсетеді. Егер коэффициент 0-ге тең мәнді қабылдаса, онда ешқандай байланыс болмайды. Мән 1-ге жақын болған сайын, параметрлер арасындағы байланыс соғұрлым 0-ге жақын болса, соғұрлым әлсіз болады;

Әдістері

Корреляциялық параметрлік әдістер қарым-қатынастың беріктігін бағалай алады. Олар қалыпты таралу заңына бағынатын параметрлерді зерттеу үшін таралуды бағалау негізінде қолданылады.

Сызықтық регрессия теңдеуінің параметрлері тәуелділік түрін, регрессия теңдеуінің функциясын анықтау және таңдалған қатынас формуласының көрсеткіштерін бағалау үшін қажет. Байланысты анықтау әдісі ретінде корреляция өрісі қолданылады. Ол үшін барлық бар деректер графикалық түрде бейнеленуі керек. Барлық белгілі мәліметтер тікбұрышты екі өлшемді координаталар жүйесінде салынуы керек. Корреляциялық өріс осылай қалыптасады. Сипаттамалық коэффициенттің мәндері абсцисса осінің бойымен, ал тәуелді фактордың мәндері ордината осінің бойымен белгіленеді. Параметрлер арасында функционалдық байланыс болса, олар сызық түрінде қатарға қойылады.

Егер мұндай деректердің корреляциялық коэффициенті 30% -дан аз болса, қосылыстың толық дерлік жоқтығы туралы айтуға болады. Егер ол 30% және 70% аралығында болса, онда бұл орташа жақын байланыстардың болуын көрсетеді. 100% көрсеткіш функционалдық байланыстың дәлелі болып табылады.

Сызықтық емес регрессия теңдеуі сызықтық сияқты, корреляциялық көрсеткішпен (R) толықтырылуы керек.

Көп регрессияға арналған корреляция

Детерминация коэффициенті еселік корреляция квадратының көрсеткіші болып табылады. Ол ұсынылған көрсеткіштер жиынтығының зерттелетін сипаттамамен тығыз байланысы туралы айтады. Сондай-ақ нәтижеге параметрлердің әсер ету сипаты туралы айтуға болады. Көптік регрессия теңдеуі осы көрсеткіш арқылы бағаланады.

Көп корреляциялық көрсеткішті есептеу үшін оның индексін есептеу қажет.

Ең кіші квадраттар әдісі

Бұл әдіс регрессия факторларын бағалау әдісі болып табылады. Оның мәні фактордың функцияға тәуелділігі нәтижесінде алынған квадраттық ауытқулардың қосындысын барынша азайту болып табылады.

Жұптық сызықтық регрессия теңдеуін осындай әдіс арқылы бағалауға болады. Теңдеудің бұл түрі көрсеткіштер арасында жұптық сызықтық байланыс анықталғанда қолданылады.

Теңдеу параметрлері

Сызықтық регрессия функциясының әрбір параметрі белгілі бір мағынаға ие. Жұпталған сызықтық регрессия теңдеуі екі параметрді қамтиды: c және m параметрі х айнымалысы бір шартты бірлікке азайған (өсетін) жағдайда y функциясының соңғы көрсеткішінің орташа өзгерісін көрсетеді. Егер х айнымалысы нөлге тең болса, онда функция c параметріне тең болады. Егер х айнымалысы нөлге тең болмаса, онда с факторы экономикалық мағына бермейді. Функцияға әсер ететін жалғыз нәрсе c факторының алдындағы белгі. Егер минус болса, онда нәтиженің өзгеруі фактормен салыстырғанда баяу деп айта аламыз. Егер плюс болса, бұл нәтиженің жылдам өзгеруін көрсетеді.

Регрессия теңдеуінің мәнін өзгертетін әрбір параметрді теңдеу арқылы көрсетуге болады. Мысалы, c факторының c = y - mx пішіні бар.

Топтастырылған деректер

Барлық ақпарат x атрибуты бойынша топтастырылған тапсырма шарттары бар, бірақ белгілі бір топ үшін тәуелді көрсеткіштің сәйкес орташа мәндері көрсетіледі. Бұл жағдайда орташа мәндер x-ке байланысты индикатордың қалай өзгеретінін сипаттайды. Осылайша, топтастырылған ақпарат регрессия теңдеуін табуға көмектеседі. Ол қатынастарды талдау ретінде қолданылады. Дегенмен, бұл әдістің кемшіліктері бар. Өкінішке орай, орташа көрсеткіштер жиі сыртқы ауытқуларға ұшырайды. Бұл ауытқулар қарым-қатынас үлгісін көрсетпейді, олар оның «шуын» жасырады. Орташа мәндер сызықтық регрессия теңдеуінен әлдеқайда нашар қарым-қатынас үлгілерін көрсетеді. Дегенмен, оларды теңдеуді табу үшін негіз ретінде пайдалануға болады. Жеке популяцияның санын сәйкес орташа мәнге көбейту арқылы топ ішіндегі у қосындысын алуға болады. Әрі қарай, сіз барлық алынған сомаларды қосып, соңғы y көрсеткішін табуыңыз керек. Xy қосынды көрсеткішімен есептеулер жасау біршама қиынырақ. Егер интервалдар аз болса, біз шартты түрде барлық бірліктерге (топ ішінде) бірдей x көрсеткішін қабылдай аламыз. x пен у көбейтінділерінің қосындысын табу үшін оны у қосындысына көбейту керек. Әрі қарай барлық сомалар қосылып, xy жалпы сомасы алынады.

Көп жұптық регрессия теңдеуі: қатынастың маңыздылығын бағалау

Бұрын талқыланғандай, көптік регрессия y = f (x 1,x 2,…,x m)+E түріндегі функцияға ие. Көбінесе мұндай теңдеу өнімге сұраныс пен ұсыныс, сатып алынған акциялар бойынша пайыздық кіріс мәселелерін шешу үшін және өндірістік шығындар функциясының себептері мен түрін зерттеу үшін қолданылады. Ол сондай-ақ макроэкономикалық зерттеулер мен есептеулердің кең ауқымында белсенді түрде қолданылады, бірақ микроэкономика деңгейінде бұл теңдеу азырақ жиі қолданылады.

Көптік регрессияның негізгі міндеті факторлардың әрқайсысы жеке және олардың жиынтығында модельдеуге жататын көрсеткішке және оның коэффициенттеріне қандай әсер ететінін одан әрі анықтау үшін ақпараттың үлкен көлемін қамтитын деректер моделін құру болып табылады. Регрессия теңдеуі әртүрлі мәндерді қабылдай алады. Бұл жағдайда қатынасты бағалау үшін әдетте екі функция түрі қолданылады: сызықтық және сызықтық емес.

Сызықтық функция келесі қатынас түрінде бейнеленген: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Бұл жағдайда a2, a m «таза» регрессия коэффициенттері болып саналады. Олар y параметрінің орташа өзгеруін әрбір сәйкес x параметрінің бір бірлікке өзгеруімен (азаюымен немесе ұлғаюымен), басқа көрсеткіштердің тұрақты мәндерінің шартымен сипаттау үшін қажет.

Сызықты емес теңдеулерде, мысалы, y=ax 1 b1 x 2 b2 ...x m bm дәрежелік функцияның түрі бар. Бұл жағдайда b 1, b 2 ..... b m көрсеткіштері икемділік коэффициенттері деп аталады, олар сәйкес x көрсеткішінің 1%-ға жоғарылауымен (азаюымен) нәтиженің қалай өзгеретінін (қанша пайызға) көрсетеді және басқа факторлардың тұрақты көрсеткішімен.

Көптік регрессияны құру кезінде қандай факторларды ескеру қажет

Көптік регрессияны дұрыс құру үшін қандай факторларға ерекше назар аудару керектігін анықтау керек.

Экономикалық факторлар мен модельденетін нәрселер арасындағы байланыстардың табиғаты туралы белгілі бір түсінік болуы керек. Қосылуы қажет факторлар келесі критерийлерге сәйкес болуы керек:

  • Сандық өлшеуге ұшырауы керек. Объектінің сапасын сипаттайтын факторды пайдалану үшін кез келген жағдайда оған сандық форма беру керек.
  • Факторлардың өзара байланысы немесе функционалдық байланысы болмауы керек. Мұндай әрекеттер көбінесе қайтымсыз салдарға әкеледі - кәдімгі теңдеулер жүйесі сөзсіз болады және бұл оның сенімсіздігі мен түсініксіз бағалауына әкеледі.
  • Үлкен корреляциялық көрсеткіш жағдайында индикатордың соңғы нәтижесіне факторлардың оқшауланған әсерін анықтау мүмкін емес, сондықтан коэффициенттер түсіндірілмейтін болады.

Құрылыс әдістері

Теңдеу үшін факторларды қалай таңдауға болатындығын түсіндіретін көптеген әдістер мен әдістер бар. Бірақ бұл әдістердің барлығы корреляциялық көрсеткішті пайдаланып коэффициенттерді таңдауға негізделген. Олардың ішінде:

  • Жою әдісі.
  • Ауыстыру әдісі.
  • Қадамдық регрессиялық талдау.

Бірінші әдіс жалпы жиынтықтан барлық коэффициенттерді сүзуді қамтиды. Екінші әдіс көптеген қосымша факторларды енгізуді қамтиды. Үшіншісі - теңдеу үшін бұрын қолданылған факторларды жою. Бұл әдістердің әрқайсысының өмір сүруге құқығы бар. Олардың жақсы және жаман жақтары бар, бірақ олардың барлығы қажетсіз көрсеткіштерді жою мәселесін өзінше шеше алады. Әдетте, әрбір жеке әдіспен алынған нәтижелер өте жақын.

Көп өлшемді талдау әдістері

Факторларды анықтаудың мұндай әдістері өзара байланысты белгілердің жеке комбинацияларын қарастыруға негізделген. Оларға дискриминантты талдау, пішінді тану, негізгі құрамдас талдау және кластерлік талдау кіреді. Сонымен қатар факторлық талдау да бар, бірақ ол компоненттік әдістің дамуына байланысты пайда болды. Олардың барлығы белгілі бір жағдайлар мен факторларға байланысты белгілі бір жағдайларда қолданылады.

Регрессиялық талдауөлшенетін мәліметтерді модельдеу және олардың қасиеттерін зерттеу әдісі. Деректер жұп мәндерден тұрады тәуелді айнымалы(жауап айнымалысы) және тәуелсіз айнымалы(түсіндірмелі айнымалы). Регрессия моделі – бұл тәуелсіз айнымалының және кездейсоқ шама қосылған параметрлердің функциясы. Үлгі параметрлері модель деректерге жақсы сәйкес келетіндей реттеледі. Жақындау сапасының критерийі (мақсатты функция) әдетте орташа квадраттық қате болып табылады: модель мәндері мен тәуелсіз айнымалының барлық мәндері үшін тәуелді айнымалы арасындағы айырмашылық квадраттарының қосындысы аргумент. Математикалық статистиканың және машиналық оқытудың регрессиялық талдау бөлімі. Тәуелді айнымалы қандай да бір модельдің және кездейсоқ шаманың мәндерінің қосындысы болып табылады деп болжанады. Деректерді құру гипотезасы деп аталатын осы шаманың таралу сипатына қатысты болжамдар жасалады. Бұл гипотезаны растау немесе теріске шығару үшін қалдық талдау деп аталатын статистикалық сынақтар жүргізіледі. Тәуелсіз айнымалыда қателер жоқ деп есептеледі. Регрессиялық талдау болжау, уақыт қатарын талдау, гипотезаларды тексеру және деректердегі жасырын қатынастарды анықтау үшін қолданылады.

Регрессиялық талдаудың анықтамасы

Үлгі функция емес, қатынас болуы мүмкін. Мысалы, регрессияны құруға арналған деректер келесідей болуы мүмкін: . Мұндай үлгіде бір айнымалы мән бірнеше айнымалы мәндерге сәйкес келеді.

Сызықтық регрессия

Сызықтық регрессия функцияның параметрлерге сызықтық тәуелді екенін болжайды. Бұл жағдайда бос айнымалыға сызықтық тәуелділік қажет емес,

Сызықтық регрессия функциясының пішіні бар жағдайда

мұнда вектордың құрамдас бөліктері берілген.

Сызықтық регрессия жағдайындағы параметр мәндері ең кіші квадраттар әдісі арқылы табылады. Бұл әдісті қолдану кездейсоқ шаманың Гаусс таралу болжамымен негізделген.

Тәуелді айнымалының нақты мәндері мен қайта құрылған мәндерінің арасындағы айырмашылықтар деп аталады регрессия қалдықтары(қалдықтар). Синонимдер әдебиетте де қолданылады: қалдықтарЖәне қателер. Алынған тәуелділіктің сапа критерийінің маңызды бағалауларының бірі қалдық квадраттарының қосындысы болып табылады:

Мұнда квадрат қателердің қосындысы.

Қалдықтардың дисперсиясы формула арқылы есептеледі

Мұнда орташа квадрат қатесі, орташа квадрат қатесі.

Графиктер көк нүктелермен көрсетілген үлгілерді және тұтас сызықтармен көрсетілген регрессия қатынастарын көрсетеді. Бос айнымалы абсцисса осі бойымен, ал тәуелді айнымалы ордината осі бойымен сызылады. Барлық үш тәуелділік параметрлерге қатысты сызықты.

Сызықты емес регрессия

Бейсызық регрессиялық модельдер – форма модельдері

оны скаляр көбейтінді ретінде көрсетуге болмайды

мұндағы регрессия моделінің параметрлері, кеңістіктегі бос айнымалы, тәуелді айнымалы, кездейсоқ шама және кейбір берілген жиыннан функция.

Сызықты емес регрессия жағдайындағы параметр мәндері градиентті түсіру әдістерінің бірін қолдану арқылы табылады, мысалы, Левенберг-Марквардт алгоритмі.

Терминдер туралы

«Регрессия» терминін 19 ғасырдың аяғында Фрэнсис Гальтон енгізген. Гальтон ата-анасының бойы ұзын немесе қысқа болатын балалары әдетте ерекше биіктікке ие болмайтынын анықтады және бұл құбылысты «орташалыққа регрессия» деп атады. Алғашында бұл термин тек биологиялық мағынада қолданылды. Карл Пирсонның еңбегінен кейін бұл термин статистикада қолданыла бастады.

Статистикалық әдебиетте бір еркін айнымалыны қамтитын регрессия мен бірнеше еркін айнымалыны қамтитын регрессия арасында айырмашылық бар. бір өлшемдіЖәне көпөлшемдірегрессия. Біз бірнеше бос айнымалыларды, яғни бос айнымалы векторды пайдаланамыз деп болжанады. Ерекше жағдайларда бос айнымалы скаляр болса, ол арқылы белгіленеді. Айыру сызықтықЖәне сызықтық емесрегрессия. Егер регрессия моделі параметрлер функцияларының сызықтық комбинациясы болмаса, онда ол сызықты емес регрессия деп аталады. Бұл жағдайда модель белгілі бір жиыннан функциялардың ерікті суперпозициясы болуы мүмкін. Сызықты емес модельдер экспоненциалды, тригонометриялық және басқалары (мысалы, радиалды негізді функциялар немесе Розенблат перцептоны), олар параметрлер мен тәуелді айнымалы арасындағы байланысты сызықты емес деп болжайды.

Айыру параметрлікЖәне параметрлік емесрегрессия. Бұл екі регрессия түрінің арасында қатаң шекара сызу қиын. Қазіргі уақытта модельдің бір түрін екіншісінен ажыратудың жалпы қабылданған критерийі жоқ. Мысалы, сызықтық модельдер параметрлік болып саналады, ал бос айнымалы кеңістіктегі тәуелді айнымалының орташа мәнін қамтитын модельдер параметрлік емес болып табылады. Параметрлік регрессия моделінің мысалы: сызықтық болжауыш, көпқабатты перцептрон. Аралас регрессия үлгісінің мысалдары: радиалды негізді функциялар. Параметрлік емес модель кейбір ені терезеде орташа мәнді жылжытады. Жалпы, параметрлік емес регрессия параметрлік регрессиядан тәуелді айнымалы бос айнымалының бір мәніне емес, осы мәннің белгілі бір маңайына тәуелді болуымен ерекшеленеді.

«Функцияның жуықтауы», «апроксимация», «интерполяция» және «регрессия» терминдерінің арасында айырмашылық бар. Ол келесідей.

Функцияларды жуықтау.Дискретті немесе үздіксіз аргументтің функциясы берілген. Белгілі бір параметрлік отбасынан функцияны табу талап етіледі, мысалы, берілген дәрежедегі алгебралық көпмүшелер арасында. Функция параметрлері ең аз кейбір функционалдылықты қамтамасыз етуі керек, мысалы,

Мерзімі жуықтау«функцияның жуықтауы» терминінің синонимі. Ол дискретті аргумент функциясы ретінде берілген функция туралы айтқан кезде жиі қолданылады. Мұнда да берілген функцияның барлық нүктелеріне ең жақын өтетін функцияны табу керек. Бұл тұжырымдаманы енгізеді қалдықтарүзіліссіз функцияның нүктелері мен дискретті аргументтік функцияның сәйкес нүктелері арасындағы қашықтық.

Интерполяциябелгілі бір нүктелерде шақыру қажет болғанда жуықтау есебінің ерекше жағдайын орындайды интерполяция түйіндеріфункцияның мәндері мен оны жақындататын функция сәйкес келді. Жалпы алғанда, туынды құралдардың белгілі бір туындыларының мәндеріне шектеулер қойылады. Яғни, дискретті аргументтің функциясы берілген. Барлық нүктелер арқылы өтетін функцияны табу талап етіледі. Бұл жағдайда метрика әдетте пайдаланылмайды, бірақ қажетті функцияның «тегістігі» түсінігі жиі енгізіледі.