Регрессия статистикасы. Excel бағдарламасындағы корреляциялық және регрессиялық талдау: орындау нұсқаулары

Регрессиялық және корреляциялық талдау – статистикалық әдістерзерттеу. Бұл параметрдің бір немесе бірнеше тәуелсіз айнымалыларға тәуелділігін көрсетудің ең кең таралған тәсілдері.

Төменде нақты практикалық мысалдарды пайдалана отырып, экономистер арасында өте танымал осы екі талдауды қарастырамыз. Оларды біріктіру кезінде нәтиже алудың мысалын да келтіреміз.

Excel бағдарламасындағы регрессиялық талдау

Кейбір мәндердің (тәуелсіз, тәуелсіз) тәуелді айнымалыға әсерін көрсетеді. Мысалы, экономикалық белсенді халық саны кәсіпорын санына, жалақыға және басқа да көрсеткіштерге қалай тәуелді. Немесе: ЖІӨ деңгейіне шетелдік инвестициялар, энергия бағасы және т.б. қалай әсер етеді.

Талдау нәтижесі басымдықтарды бөліп көрсетуге мүмкіндік береді. Ал негізгі факторларға сүйене отырып, басым бағыттардың дамуын болжау, жоспарлау, басқару шешімдерін қабылдау.

Регрессия жүреді:

  • сызықтық (y = a + bx);
  • параболалық (y = a + bx + cx 2);
  • экспоненциалды (y = a * exp(bx));
  • қуат (y = a*x^b);
  • гиперболалық (y = b/x + a);
  • логарифмдік (y = b * 1n(x) + a);
  • экспоненциалды (y = a * b^x).

Excel бағдарламасында регрессия үлгісін құру және нәтижелерді түсіндіру мысалын қарастырайық. Регрессияның сызықтық түрін алайық.

Тапсырма. 6 кәсіпорында орташа айлық еңбекақы және жұмыстан кеткен қызметкерлер саны талданды. Жұмыстан шығатын қызметкерлер санының орташа жалақыға тәуелділігін анықтау қажет.

Үлгі сызықтық регрессиякелесі нысаны бар:

Y = a 0 + a 1 x 1 +…+a k x k.

Мұндағы a регрессия коэффициенттері, х – әсер етуші айнымалылар, k – факторлар саны.

Біздің мысалда Y - қызметкерлердің жұмыстан шығу көрсеткіші. Әсер етуші фактор – жалақы (х).

Excel бағдарламасында сызықтық регрессия үлгісінің параметрлерін есептеуге көмектесетін кірістірілген функциялар бар. Бірақ «Талдау пакеті» қондырмасы мұны жылдамырақ жасайды.

Біз қуатты аналитикалық құралды іске қосамыз:

Қосылғаннан кейін қондырма Деректер қойындысында қолжетімді болады.

Енді регрессиялық талдаудың өзін жасайық.



Ең алдымен, R-квадрат пен коэффициенттерге назар аударамыз.

R-квадрат – детерминация коэффициенті. Біздің мысалда – 0,755 немесе 75,5%. Бұл модельдің есептелген параметрлері зерттелетін параметрлер арасындағы байланыстың 75,5% түсіндіреді дегенді білдіреді. Детерминация коэффициенті неғұрлым жоғары болса, модель соғұрлым жақсы болады. Жақсы - 0,8 жоғары. Нашар – 0,5-тен аз (мұндай талдауды негізді деп санауға болмайды). Біздің мысалда – «жаман емес».

64.1428 коэффициенті қарастырылатын модельдегі барлық айнымалылар 0-ге тең болса, Y қандай болатынын көрсетеді. Яғни, талданатын параметрдің мәніне модельде сипатталмаған басқа факторлар да әсер етеді.

-0,16285 коэффициенті X айнымалысының Y бойынша салмағын көрсетеді. Яғни, осы үлгідегі орташа айлық жалақы -0,16285 салмағы бар жұмыстан бас тартушылардың санына әсер етеді (бұл аз әсер ету дәрежесі). «-» белгісі теріс әсерді көрсетеді: жалақы неғұрлым жоғары болса, соғұрлым аз адам жұмыстан кетеді. Қайсысы әділ.



Excel бағдарламасындағы корреляциялық талдау

Корреляциялық талдау бір немесе екі үлгідегі көрсеткіштер арасында байланыс бар-жоғын анықтауға көмектеседі. Мысалы, машинаның жұмыс істеу уақыты мен жөндеу құнының арасында, жабдықтың бағасы мен жұмыс ұзақтығы, балалардың бойы мен салмағы және т.б.

Егер байланыс бар болса, онда бір параметрдің жоғарылауы екіншісінің өсуіне (оң корреляцияға) немесе төмендеуіне (теріс) әкеледі. Корреляциялық талдау талдаушыға бір көрсеткіштің мәнін болжау үшін пайдалануға болатынын анықтауға көмектеседі мүмкін мағынасыбасқа.

Корреляция коэффициенті r арқылы белгіленеді. +1 мен -1 аралығында өзгереді. Классификация корреляцияларБұл әртүрлі аймақтар үшін әртүрлі болады. Коэффицент 0 болғанда сызықтық тәуелділікүлгілер арасында болмайды.

Excel бағдарламасының көмегімен корреляция коэффициентін қалай табуға болатынын қарастырайық.

Жұпталған коэффициенттерді табу үшін CORREL функциясы қолданылады.

Мақсаты: Токарлық станоктың жұмыс уақыты мен оған қызмет көрсету құнының арасында тәуелділік бар-жоғын анықтау.

Курсорды кез келген ұяшыққа қойып, fx түймесін басыңыз.

  1. «Статистикалық» санатында CORREL функциясын таңдаңыз.
  2. «1-массив» аргументі – мәндердің бірінші диапазоны – машинаның жұмыс уақыты: A2:A14.
  3. «2-массив» аргументі – мәндердің екінші диапазоны – жөндеу құны: B2:B14. OK түймесін басыңыз.

Байланыс түрін анықтау үшін коэффициенттің абсолютті санына қарау керек (әрбір қызмет саласының өз масштабы бар).

Бірнеше параметрлердің (2-ден астам) корреляциялық талдауы үшін «Деректерді талдау» («Талдау пакеті» қосымшасы) пайдалану ыңғайлырақ. Тізімнен корреляцияны таңдап, массивті белгілеу керек. Барлығы.

Алынған коэффициенттер корреляциялық матрицада көрсетіледі. Бұл сияқты:

Корреляциялық және регрессиялық талдау

Іс жүзінде бұл екі әдіс жиі бірге қолданылады.

Мысалы:


Енді регрессиялық талдау деректері көрінді.

1. «Регрессия» терминін алғаш рет биометриканың негізін салушы Ф.Гальтон (19 ғ.) енгізді, оның идеяларын оның ізбасары К.Пирсон дамытты.

Регрессиялық талдау - әдіс статистикалық өңдеубір немесе бірнеше себептер (факторлық сипаттамалар) мен салдар (нәтижелік сипаттама) арасындағы байланысты өлшеуге мүмкіндік беретін деректер.

Қол қою- бұл ең бастысы ерекшеленетін қасиеті, зерттелетін құбылыстың немесе процестің ерекшелігі.

Тиімді белгі -зерттелетін көрсеткіш.

Фактор белгісі- нәтижелі сипаттаманың мәніне әсер ететін көрсеткіш.

Регрессиялық талдаудың мақсаты бағалау болып табылады функционалдық тәуелділікалынған сипаттаманың орташа мәні ( сағ) факторынан ( x 1, x 2, …, x n), ретінде өрнектеледі регрессия теңдеулері

сағ= f(x 1, x 2, …, x n). (6.1)

Регрессияның екі түрі бар: жұптық және көптік.

Жұпталған (қарапайым) регрессия- түрдегі теңдеу:

сағ= f(x). (6.2)

Жұптық регрессиядағы нәтиже бір аргументтің функциясы ретінде қарастырылады, яғни. бір факторға тән.

Регрессиялық талдау келесі қадамдарды қамтиды:

· функцияның түрін анықтау;

· регрессия коэффициенттерін анықтау;

· алынған сипаттаманың теориялық мәндерін есептеу;

· регрессия коэффициенттерінің статистикалық маңыздылығын тексеру;

· регрессия теңдеуінің статистикалық маңыздылығын тексеру.

Көптік регрессия- түрдегі теңдеу:

сағ= f(x 1, x 2, …, x n). (6.3)

Алынған атрибут бірнеше аргументтердің функциясы ретінде қарастырылады, яғни. көптеген факторлардың белгілері.

2. Функцияның түрін дұрыс анықтау үшін теориялық мәліметтерге сүйене отырып, байланыс бағытын табу керек.

Байланыс бағыты бойынша регрессия келесіге бөлінеді:

· тікелей регрессиятәуелсіз құнның ұлғаюы немесе төмендеуі жағдайында туындайтын " X"тәуелді шаманың мәндері» у"сондай-ақ сәйкесінше ұлғайту немесе азайту;

· кері регрессиятәуелсіз мәннің ұлғаюы немесе төмендеуі жағдайында туындайтын "X"тәуелді мөлшер» у"сәйкес азаяды немесе артады.

Қарым-қатынастарды сипаттау үшін жұпталған регрессия теңдеулерінің келесі түрлері қолданылады:

· y=a+bxсызықтық;

· y=e ax + b – экспоненциалды;

· y=a+b/x – гиперболалық;

· y=a+b 1 x+b 2 x 2 – параболалық;

· y=ab x – экспоненциалдыт.б.

Қайда a, b 1, b 2- теңдеудің коэффициенттері (параметрлері); сағ- тиімді белгі; X- фактор белгісі.

3. Регрессия теңдеуін құру оның коэффициенттерін (параметрлерін) бағалауға түседі, ол үшін біз пайдаланамыз әдіс ең кіші квадраттар (MNC).

Ең кіші квадраттар әдісі нәтиже атрибутының нақты мәндерінің квадраттық ауытқуларының қосындысы болатын параметрлерді бағалауға мүмкіндік береді. сағ«теориялықтан» y x» минималды, яғни

Регрессия теңдеуінің параметрлері y=a+bхЕң кіші квадраттар әдісімен формулалар арқылы бағаланады:

Қайда A -еркін коэффициент, б- регрессия коэффициенті нәтиже белгісінің қаншалықты өзгеретінін көрсетеді « ж«фактор сипаттамасы өзгергенде» x» өлшем бірлігіне.

4. Регрессия коэффициенттерінің статистикалық маңыздылығын бағалау үшін Стьюденттің t-тесті қолданылады.

Регрессия коэффициенттерінің маңыздылығын тексеру схемасы:

1) H 0:a=0, б=0 - регрессия коэффициенттері нөлден айтарлықтай айырмашылығы жоқ.

H 1: a≠ 0, b≠ 0 - регрессия коэффициенттері нөлден айтарлықтай ерекшеленеді.

2) r=0,05 – маңыздылық деңгейі.

Қайда м б,м а- кездейсоқ қателер:

; . (6.7)

4) t кесте(p; f),

Қайда f=n-k- 1 - еркіндік дәрежесінің саны (кестелік мән), n- бақылаулар саны, к X".

5) Егер , онда ол қабылданбады, яғни. коэффициенті маңызды.

Егер , онда ол қабылданады, яғни. коэффициенті шамалы.

5. Құрылған регрессия теңдеуінің дұрыстығын тексеру үшін Фишер критерийі қолданылады.

Регрессия теңдеуінің маңыздылығын тексеру схемасы:

1) H 0:Регрессия теңдеуі маңызды емес.

H 1:Регрессия теңдеуі маңызды.

2) r=0,05 – маңыздылық деңгейі.

3) , (6.8)

бақылаулар саны қайда; к- айнымалылары бар теңдеудегі параметрлер саны » X"; сағ- нәтижелік атрибуттың нақты мәні; y x- нәтижелік белгінің теориялық мәні; - жұптық корреляция коэффициенті.

4) F кестесі(p; f 1 ; f 2),

Қайда f 1 =k, f 2 =n-k-1-еркіндік дәрежелерінің саны (кестелік мәндер).

5) Егер F есептелген >F кестесі, онда регрессия теңдеуі дұрыс таңдалады және оны тәжірибеде қолдануға болады.

Егер F есептеу , онда регрессия теңдеуі дұрыс таңдалмаған.

6. Регрессиялық талдаудың сапасын көрсететін негізгі көрсеткіш болып табылады детерминация коэффициенті (R 2).

Анықтау коэффициентітәуелді айнымалының қандай үлесін көрсетеді» сағ« талдауда ескеріледі және оған талдауға енгізілген факторлардың әсерінен туындайды.

Анықтау коэффициенті (R 2)аралықтағы мәндерді қабылдайды. Регрессия теңдеуі сапалы, егер R 2 ≥0,8.

Детерминация коэффициенті корреляция коэффициентінің квадратына тең, яғни.

6.1-мысал.Төмендегі мәліметтер негізінде регрессия теңдеуін құрыңыз және талдаңыз:

Шешім.

1) Корреляция коэффициентін есептеңіз: . Белгілер арасындағы байланыс тікелей және қалыпты.

2) Жұпталған сызықтық регрессия теңдеуін құрыңыз.

2.1) Есептеу кестесін құру.

X сағ Ху x 2 y x (ж-ж х) 2
55,89 47,54 65,70
45,07 15,42 222,83
54,85 34,19 8,11
51,36 5,55 11,27
42,28 45,16 13,84
47,69 1,71 44,77
45,86 9,87 192,05
сомасы 159,45 558,55
Орташа 77519,6 22,78 79,79 2990,6

,

Жұпталған сызықтық регрессия теңдеуі: y x =25,17+0,087x.

3) Теориялық мәндерді табыңыз» y x"регрессия теңдеуіне нақты мәндерді ауыстыру арқылы" X».

4) «Нақтының графиктерін құру» у"және теориялық құндылықтар» y x«тиімді сипаттама (6.1-сурет):r xy =0,47) және бақылаулардың аз саны.

7) Детерминация коэффициентін есептеңіз: R 2=(0,47) 2 =0,22. Құрылған теңдеу сапасыз.

Өйткені регрессиялық талдауды орындау кезінде есептеулер өте кең, арнайы бағдарламаларды пайдалану ұсынылады (Statistica 10, SPSS және т.б.).

6.2-суретте Statistica 10 бағдарламасы арқылы жүргізілген регрессиялық талдау нәтижелері көрсетілген кесте көрсетілген.

6.2-сурет. Statistica 10 бағдарламасы арқылы жүргізілген регрессиялық талдау нәтижелері

5. Әдебиет:

1. Гмурман В.Е. Ықтималдықтар теориясы және математикалық статистика: Оқу құралы. университеттерге арналған оқу құралы / В.Е. Гмурман. – М.: Жоғары мектеп, 2003. – 479 б.

2. Қойчубеков Б.Қ. Биостатистика: Оқулық. – Алматы: Эверо, 2014. – 154 б.

3. Лоботская Н.Л. Жоғары математика. / Н.Л. Лоботская, Ю.В. Морозов, А.А. Дунаев. – Мн.: Жоғары мектеп, 1987. – 319 б.

4. Дәрігер В.А., Токмачев М.С., Балықшы Б.Б. Медицина және биологиядағы статистика: нұсқаулық. 2 томда / Ред. Ю.М. Комарова. T. 1. Теориялық статистика. – М.: Медицина, 2000. – 412 б.

5. Қоғамдық денсаулықты және денсаулық сақтауды зерттеу үшін статистикалық талдау әдістерін қолдану: оқу құралы / ред. Кучеренко В.З. - 4-бас., қайта қаралған. және қосымша – М.: ГЕОТАР - Медиа, 2011. - 256 б.

Регрессиялық талдау белгілі бір шаманың басқа шамаға немесе бірнеше басқа шамаға тәуелділігін зерттейді. Регрессиялық талдау негізінен орта мерзімді болжауда, сондай-ақ ұзақ мерзімді болжауда қолданылады. Орта және ұзақ мерзімді кезеңдер кәсіпкерлік ортадағы өзгерістерді анықтауға және осы өзгерістердің зерттелетін көрсеткішке әсерін есепке алуға мүмкіндік береді.

Регрессиялық талдауды орындау үшін сізге қажет:

    зерттелетін көрсеткіштер бойынша жылдық деректердің болуы,

    бір реттік болжамдардың болуы, яғни. жаңа деректердің келуімен түзетілмейтін мұндай болжамдар.

Регрессиялық талдау әдетте күрделі, көп факторлы сипатқа ие объектілер үшін жүргізіледі, мысалы, инвестиция көлемі, пайда, сату көлемі және т.б.

Сағат нормативтік болжау әдісімақсат ретінде қабылданған құбылыстың мүмкін күйлеріне жету жолдары мен мерзімдері айқындалады. Бұл алдын ала белгіленген нормалар, идеалдар, ынталандырулар мен мақсаттар негізінде құбылыстың қалаған күйлеріне жетуді болжау туралы. Бұл болжам сұраққа жауап береді: сіз қалаған нәрсеге қандай жолдармен қол жеткізе аласыз? Нормативтік әдіс көбінесе бағдарламалық немесе мақсатты болжамдар үшін қолданылады. Стандарттың сандық көрінісі де, бағалау функциясының мүмкіндіктерінің белгілі шкаласы да қолданылады.

Сандық өрнекті пайдаланған жағдайда, мысалы, белгілі бір азық-түлік және азық-түлік емес тауарларды тұтынудың физиологиялық және рационалды нормалары, халықтың әртүрлі топтары үшін мамандар әзірлеген, осы тауарларды тұтыну деңгейін анықтауға болады. көрсетілген нормаға қол жеткізудің алдындағы жылдар. Мұндай есептеулер интерполяция деп аталады. Интерполяция – белгіленген қатынасқа негізделген құбылыстың динамикалық қатарында жоқ көрсеткіштерді есептеу әдісі. Динамикалық қатардың шеткі мүшелері ретінде көрсеткіштің нақты мәнін және оның стандарттарының мәнін ала отырып, осы қатардағы мәндердің мәндерін анықтауға болады. Сондықтан интерполяция нормативті әдіс болып саналады. Экстраполяцияда қолданылған бұрын берілген (4) формуланы интерполяцияда қолдануға болады, мұнда y енді нақты деректерді емес, стандартты көрсеткішті сипаттайды.

Нормативтік әдісте шкала (өріс, спектр) пайдаланылған жағдайда бағалау функциясының мүмкіндіктері, яғни артықшылықты бөлу функциясы шамамен келесі градацияны көрсетеді: қалаусыз - аз қалаусыз - көбірек қажет - ең қажет - оңтайлы ( стандарт).

Нормативтік болжау әдісі объективтілік деңгейін, демек, шешімдердің тиімділігін арттыру бойынша ұсыныстар әзірлеуге көмектеседі.

Модельдеу, мүмкін ең күрделі болжау әдісі. Математикалық модельдеу экономикалық құбылысты математикалық формулалар, теңдеулер және теңсіздіктер арқылы сипаттауды білдіреді. Математикалық аппарат болжамды объектінің барлық тереңдігі мен күрделілігін толық көрсету өте қиын болғанымен, болжамдық фонын дәл көрсетуі керек. «Модель» термині латынның modelus сөзінен шыққан, ол «өлшеу» дегенді білдіреді. Сондықтан модельдеуді болжау әдісі емес, модельді пайдалана отырып, ұқсас құбылысты зерттеу әдісі деп қарастыру дұрысырақ болар еді.

Кең мағынада модельдер зерттеу объектісі туралы жаңа білім алуға мүмкіндік беретін оған ұқсас зерттеу объектісін алмастырады. Модельді объектінің математикалық сипаттамасы ретінде қарастыру керек. Бұл жағдайда модель зерттелетін объектімен белгілі бір сәйкестікте болатын және оны зерттеу процесінде объект туралы ақпаратты ұсынатын құбылыс (объект, орнату) ретінде анықталады.

Модельді неғұрлым тар түсіну арқылы оны болжау объектісі ретінде қарастырады, оны зерттеу объектінің болашақта мүмкін болатын күйлері және осы күйлерге жету жолдары туралы ақпарат алуға мүмкіндік береді; Бұл жағдайда болжамдық модельдің мақсаты жалпы объект туралы емес, тек оның болашақ күйлері туралы ақпарат алу болып табылады. Содан кейін модельді құру кезінде оның объектімен сәйкестігін тікелей тексеру мүмкін болмауы мүмкін, өйткені модель тек оның болашақ күйін білдіреді, ал объектінің өзі қазіргі уақытта болмауы немесе басқаша болуы мүмкін.

Модельдер материалды немесе идеалды болуы мүмкін.

Экономика идеалды үлгілерді пайдаланады. Әлеуметтік-экономикалық (экономикалық) құбылысты сандық сипаттаудың ең жетілдірілген идеалды үлгісі сандарды, формулаларды, теңдеулерді, алгоритмдерді немесе графикалық бейнелеуді қолданатын математикалық модель болып табылады. Экономикалық модельдерді пайдалана отырып, олар анықтайды:

    әртүрлі экономикалық көрсеткіштер арасындағы тәуелділік;

    көрсеткіштерге қойылатын әртүрлі шектеулер;

    процесті оңтайландыру критерийлері.

Объектінің мағыналы сипаттамасы оның формалды диаграммасы түрінде берілуі мүмкін, ол қажетті шамаларды есептеу үшін қандай параметрлер мен бастапқы ақпаратты жинау қажет екенін көрсетеді. Математикалық модель, формальды схемадан айырмашылығы, ол объектіні сипаттайтын нақты сандық деректерді қамтиды. Өз идеяларына сүйене отырып, ол жұмыс гипотезасын алға тартады, оның көмегімен формулалар, теңдеулер және теңсіздіктер түріндегі модельдің аналитикалық жазбасы жасалады. Теңдеулер жүйесін шешу нәтижесінде функцияның белгілі бір параметрлері алынады, олар уақыт бойынша қажетті айнымалылардың өзгеруін сипаттайды.

Болжауды ұйымдастыру элементі ретінде жұмыстың реті мен реттілігі қолданылатын болжау әдісіне байланысты анықталады. Әдетте бұл жұмыс бірнеше кезеңде орындалады.

1-кезең – болжамдық ретроспекция, яғни болжам объектісі мен болжамдық фонын белгілеу. Бірінші кезеңдегі жұмыс келесі реттілікпен орындалады:

    объектінің алдын ала болжамды талдауын, оның параметрлерін, олардың маңыздылығын және өзара байланыстарын бағалауды қамтитын өткендегі объектінің сипаттамасын қалыптастыру;

    ақпарат көздерін анықтау және бағалау, олармен жұмыс тәртібі мен ұйымдастыру, ретроспективті ақпаратты жинау және орналастыру;

    зерттеу мақсаттарын қою.

Болжамдық ретроспекция тапсырмаларын орындай отырып, болжаушылар объектінің даму тарихын және олардың жүйелі сипаттамасын алу үшін болжамдық негізді зерттейді.

2-кезең – болжамдық диагностика, оның барысында олардың даму тенденцияларын анықтау және модельдер мен болжау әдістерін таңдау мақсатында болжау объектісінің және болжамдық фонның жүйелі сипаттамасы зерттеледі. Жұмыс келесі реттілікпен орындалады:

    болжау объектісінің үлгісін әзірлеу, оның ішінде нысанның ресімделген сипаттамасы, модельдің объектіге сәйкестік дәрежесін тексеру;

    болжау әдістерін таңдау (негізгі және көмекші), алгоритм және жұмыс бағдарламаларын жасау.

3-кезең – қорғау, яғни болжамды кең көлемде әзірлеу процесі, оның ішінде: 1) берілген жетекші кезеңдегі болжамды параметрлерді есептеу; 2) болжамның жеке құрамдастарының синтезі.

4-кезең – болжамды бағалау, оның ішінде оны тексеру, яғни сенімділік, дәлдік және негізділік дәрежесін анықтау.

Іздеу және бағалау барысында алдыңғы кезеңдерге сүйене отырып, болжау және оны бағалау мәселелері шешіледі.

Көрсетілген кезеңдер шамамен алынған және негізгі болжау әдісіне байланысты.

Болжамдық нәтижелер анықтама, есеп немесе басқа материал түрінде ресімделеді және тапсырыс берушіге ұсынылады.

Болжау кезінде болжамның объектінің нақты күйінен ауытқу шамасын көрсетуге болады, ол болжам қатесі деп аталады, ол мына формуламен есептеледі:

;
;
. (9.3)

Болжаудағы қателіктердің көздері

Негізгі көздер болуы мүмкін:

1. Өткеннен болашаққа деректерді қарапайым тасымалдау (экстраполяция) (мысалы, компанияда сатудың 10% өсуінен басқа болжамдық нұсқалары жоқ).

2. Оқиғаның ықтималдығын және оның зерттелетін объектіге әсерін дәл анықтай алмау.

3. Жоспардың орындалуына әсер ететін күтпеген қиындықтар (бұзушы оқиғалар), мысалы, сату бөлімінің бастығының кенеттен жұмыстан босатылуы.

Жалпы, болжау тәжірибесі жинақталған сайын және оның әдістері нақтыланған сайын болжау дәлдігі артады.

Регрессиялық талдау – белгілі бір параметрдің бір немесе бірнеше тәуелсіз айнымалыларға тәуелділігін көрсетуге мүмкіндік беретін статистикалық зерттеу әдісі. Компьютерге дейінгі дәуірде оны пайдалану өте қиын болды, әсіресе деректердің үлкен көлеміне қатысты. Бүгінгі күні Excel бағдарламасында регрессияны құруды үйрене отырып, сіз бірнеше минут ішінде күрделі статистикалық есептерді шеше аласыз. Төменде экономика саласының нақты мысалдары келтірілген.

Регрессия түрлері

Бұл ұғымның өзі математикаға 1886 жылы енгізілген. Регрессия жүреді:

  • сызықтық;
  • параболалық;
  • тыныштандырғыш;
  • экспоненциалды;
  • гиперболалық;
  • демонстрациялық;
  • логарифмдік.

1-мысал

6 өнеркәсіптік кәсіпорында жұмыстан шыққан бригада мүшелерінің санының орташа жалақыға тәуелділігін анықтау мәселесін қарастырайық.

Тапсырма. Алты кәсіпорында орташа айлық жалақы мен өз еркімен жұмыстан кеткен қызметкерлердің саны талданды. Кесте түрінде бізде:

Жұмыстан шыққандар саны

Жалақы

30 000 рубль

35 000 рубль

40 000 рубль

45 000 рубль

50 000 рубль

55 000 рубль

60 000 рубль

6 кәсіпорындағы жұмыстан босатылған жұмысшылар санының орташа жалақыдан тәуелділігін анықтау тапсырмасы үшін регрессиялық модель Y = a 0 + a 1 x 1 +...+a k x k теңдеуінің нысанына ие, мұндағы x i - айнымалыларға әсер етуші, a i – регрессия коэффициенттері, ал k – факторлар саны.

Бұл мәселе бойынша Y - жұмыстан шыққан қызметкерлердің көрсеткіші, ал әсер етуші фактор - жалақы, оны біз Х деп белгілейміз.

Excel электрондық кесте процессорының мүмкіндіктерін пайдалану

Excel бағдарламасындағы регрессиялық талдаудың алдында бұрыннан бар кестелік деректерге кірістірілген функцияларды қолдану қажет. Дегенмен, бұл мақсаттар үшін өте пайдалы «Талдау жинағы» қосымшасын қолданған дұрыс. Оны іске қосу үшін сізге қажет:

  • «Файл» қойындысынан «Параметрлер» бөліміне өтіңіз;
  • ашылған терезеде «Қосымшалар» жолын таңдаңыз;
  • төменде, «Басқару» жолының оң жағында орналасқан «Өту» түймесін басыңыз;
  • «Талдау бумасы» атауының жанындағы құсбелгіні қойыңыз және «Жарайды» түймесін басу арқылы әрекеттеріңізді растаңыз.

Егер бәрі дұрыс орындалса, Excel жұмыс парағының үстінде орналасқан «Деректер» қойындысының оң жағында қажетті түймешік пайда болады.

Excel бағдарламасында

Енді бізде эконометриялық есептеулерді жүргізу үшін барлық қажетті виртуалды құралдар бар, біз өз мәселемізді шешуге кірісе аламыз. Мұны істеу үшін:

  • «Деректерді талдау» түймесін басыңыз;
  • ашылған терезеде «Регрессия» түймесін басыңыз;
  • пайда болатын қойындыда Y (жұмыстан шығатын қызметкерлер саны) және X (олардың жалақысы) үшін мәндер ауқымын енгізіңіз;
  • Біз «OK» түймесін басу арқылы әрекеттерімізді растаймыз.

Нәтижесінде бағдарлама автоматты түрде регрессиялық талдау деректерімен жаңа электрондық кестені толтырады. Назар аударыңыз! Excel осы мақсат үшін қалаған орынды қолмен орнатуға мүмкіндік береді. Мысалы, бұл Y және X мәндері орналасқан парақ немесе тіпті осындай деректерді сақтау үшін арнайы жасалған жаңа жұмыс кітабы болуы мүмкін.

R-квадрат үшін регрессия нәтижелерін талдау

Excel бағдарламасында қарастырылып отырған мысалдағы деректерді өңдеу кезінде алынған деректер келесі пішінге ие:

Ең алдымен, R-квадрат мәніне назар аудару керек. Ол детерминация коэффициентін білдіреді. Бұл мысалда R-квадрат = 0,755 (75,5%), яғни модельдің есептелген параметрлері қарастырылатын параметрлер арасындағы байланысты 75,5%-ға түсіндіреді. Детерминация коэффициентінің мәні неғұрлым жоғары болса, таңдалған модель нақты тапсырма үшін неғұрлым қолайлы болады. R-квадрат мәні 0,8-ден жоғары болғанда нақты жағдайды дұрыс сипаттау үшін қарастырылады. R-шаршы болса<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Мүмкіндіктерді талдау

64.1428 саны біз қарастырып отырған үлгідегі барлық xi айнымалылары нөлге қалпына келтірілсе, Y мәні қандай болатынын көрсетеді. Басқаша айтқанда, талданатын параметрдің мәніне нақты модельде сипатталмаған басқа факторлар да әсер етеді деп айтуға болады.

Келесі коэффициент -0,16285, В18 ұяшығында орналасқан, X айнымалысының Y-ге әсерінің салмағын көрсетеді. Бұл қарастырылып отырған үлгідегі қызметкерлердің орташа айлық жалақысы -0,16285 салмағы бар жұмыстан кетушілер санына әсер ететінін білдіреді, яғни. оның әсер ету дәрежесі мүлде аз. «-» белгісі коэффициенттің теріс екенін көрсетеді. Бұл анық, өйткені кәсіпорындағы жалақы неғұрлым жоғары болса, соғұрлым аз адамдар еңбек шартын бұзуға немесе жұмыстан шығуға ниет білдіретінін біледі.

Көптік регрессия

Бұл термин пішіннің бірнеше тәуелсіз айнымалылары бар қатынас теңдеуін білдіреді:

y=f(x 1 +x 2 +…x m) + ε, мұндағы y – нәтижелік сипаттама (тәуелді айнымалы) және x 1, x 2,…x m – факторлық сипаттамалар (тәуелсіз айнымалылар).

Параметрді бағалау

Көптік регрессия (MR) үшін ол ең кіші квадраттар әдісі (OLS) арқылы жүзеге асырылады. Y = a + b 1 x 1 +…+b m x m + ε түріндегі сызықтық теңдеулер үшін қалыпты теңдеулер жүйесін саламыз (төменде қараңыз)

Әдістің принципін түсіну үшін екі факторлы жағдайды қарастырыңыз. Сонда біз формуламен сипатталған жағдайға ие боламыз

Осыдан біз аламыз:

мұндағы σ – индексте көрсетілген сәйкес белгінің дисперсиясы.

OLS стандартталған шкаладағы MR теңдеуіне қолданылады. Бұл жағдайда мына теңдеуді аламыз:

онда t y, t x 1, … t xm стандартталған айнымалылар болып табылады, олар үшін орташа мәндері 0-ге тең; β i – стандартталған регрессия коэффициенттері, ал стандартты ауытқу 1-ге тең.

Бұл жағдайда барлық β i нормаланған және орталықтандырылған деп көрсетілгенін ескеріңіз, сондықтан оларды бір-бірімен салыстыру дұрыс және қолайлы болып саналады. Бұған қоса, ең төменгі βi мәндері бар факторларды алып тастау арқылы факторларды скринингке түсіру әдеттегідей.

Сызықтық регрессия теңдеуін қолдану мәселесі

Бізде соңғы 8 айдағы нақты N өнімінің баға динамикасының кестесі бар делік. Оның партиясын 1850 рубль/т бағамен сатып алудың орындылығы туралы шешім қабылдау қажет.

ай саны

ай атауы

өнімнің бағасы N

тоннасына 1750 рубль

тоннасына 1755 рубль

тоннасына 1767 рубль

тоннасына 1760 рубль

тоннасына 1770 рубль

тоннасына 1790 рубль

тоннасына 1810 рубль

тоннасына 1840 рубль

Excel электрондық кесте процессорында бұл мәселені шешу үшін жоғарыда келтірілген мысалдан белгілі «Деректерді талдау» құралын пайдалану керек. Содан кейін «Регрессия» бөлімін таңдап, параметрлерді орнатыңыз. «Енгізу аралығы Y» өрісінде тәуелді айнымалы үшін мәндер ауқымын (бұл жағдайда жылдың белгілі айларындағы тауарлардың бағасы) және «X енгізу аралығы» жолында енгізу керек екенін есте ұстаған жөн. - тәуелсіз айнымалы үшін (ай саны). «Жарайды» түймесін басу арқылы әрекетті растаңыз. Жаңа парақта (егер көрсетілген болса) регрессия үшін деректерді аламыз.

Оларды пайдалана отырып, y=ax+b түріндегі сызықтық теңдеуді тұрғызамыз, мұнда а және b параметрлері ай санының атауы бар жолдың коэффициенттері және парағы бар «Y-қиылысы» коэффициенттері мен сызықтары болып табылады. регрессиялық талдау нәтижелері. Осылайша, 3-тапсырманың сызықтық регрессия теңдеуі (LR) былай жазылады:

Өнімнің бағасы N = 11,714* ай саны + 1727,54.

немесе алгебралық белгілеуде

у = 11,714 x + 1727,54

Нәтижелерді талдау

Алынған сызықтық регрессия теңдеуінің адекватты екенін анықтау үшін көп корреляция (MCC) және анықтау коэффициенттері, сондай-ақ Фишер сынағы мен Студент t тесті қолданылады. Регрессия нәтижелері бар Excel электрондық кестесінде олар сәйкесінше бірнеше R, R-квадрат, F-статистика және t-статистика деп аталады.

KMC R тәуелсіз және тәуелді айнымалылар арасындағы ықтималдық қатынастың жақындығын бағалауға мүмкіндік береді. Оның жоғары мәні «Айдың саны» және «1 тоннаға рубльдегі N өнімінің бағасы» айнымалылары арасындағы жеткілікті күшті байланысты көрсетеді. Дегенмен, бұл қарым-қатынастың табиғаты белгісіз.

R2 (RI) анықтау коэффициентінің квадраты жалпы шашыраудың үлес салмағының сандық сипаттамасы болып табылады және эксперименттік деректердің қай бөлігінің шашырауын көрсетеді, яғни. тәуелді айнымалының мәндері сызықтық регрессия теңдеуіне сәйкес келеді. Қарастырылып отырған мәселеде бұл мән 84,8%-ға тең, яғни статистикалық мәліметтер алынған SD жоғары дәлдікпен сипатталады.

F-статистикасы Фишер сынағы деп те аталады, сызықтық қатынастың маңыздылығын бағалау, оның бар екендігі туралы гипотезаны жоққа шығару немесе растау үшін қолданылады.

(Студенттік тест) сызықтық байланыстың белгісіз немесе еркін мүшесі бар коэффициенттің маңыздылығын бағалауға көмектеседі. Егер t-тестінің мәні > tcr болса, онда сызықтық теңдеудің бос мүшесінің елеусіздігі туралы гипотеза жоққа шығарылады.

Еркін терминге қарастырылып отырған есепте Excel құралдарының көмегімен t = 169,20903 және p = 2,89E-12, яғни бос терминнің елеусіздігі туралы дұрыс гипотезаны жоққа шығару ықтималдығы нөлге тең екені анықталды. . Белгісіз коэффициент үшін t=5,79405, және p=0,001158. Басқаша айтқанда, белгісіз үшін коэффициенттің шамалылығы туралы дұрыс гипотезаны жоққа шығару ықтималдығы 0,12% құрайды.

Осылайша, алынған сызықтық регрессия теңдеуі адекватты деп айтуға болады.

Акциялар пакетін сатып алудың орындылығы мәселесі

Excel бағдарламасындағы бірнеше регрессия бірдей Деректерді талдау құралы арқылы орындалады. Арнайы қолданбалы мәселені қарастырайық.

NNN компаниясының басшылығы «МММ» АҚ 20% акциясын сатып алудың орындылығы туралы шешім қабылдауы керек. Пакет құны (СП) 70 миллион АҚШ долларын құрайды. NNN мамандары ұқсас транзакциялар туралы деректер жинады. Акцияның құнын миллиондаған АҚШ долларымен көрсетілген параметрлер бойынша бағалау туралы шешім қабылданды:

  • кредиторлық берешек (VK);
  • жылдық айналым көлемі (VO);
  • дебиторлық берешек (VD);
  • негізгі қорлардың құны (НҚ).

Сонымен қатар кәсіпорынның еңбекақы бойынша берешегі (V3 P) мың АҚШ долларындағы параметрі қолданылады.

Excel электрондық кестелік процессоры арқылы шешім

Ең алдымен бастапқы деректер кестесін жасау керек. Бұл келесідей көрінеді:

  • «Деректерді талдау» терезесіне қоңырау шалыңыз;
  • «Регрессия» бөлімін таңдаңыз;
  • «Y енгізу аралығы» жолағына G бағанынан тәуелді айнымалы мәндер ауқымын енгізіңіз;
  • «X енгізу аралығы» терезесінің оң жағындағы қызыл көрсеткі бар белгішені басып, парақта B, C, D, F бағандарының барлық мәндерінің ауқымын бөлектеңіз.

«Жаңа жұмыс парағы» элементін белгілеп, «Жарайды» түймесін басыңыз.

Берілген мәселе бойынша регрессиялық талдауды алыңыз.

Нәтижелер мен қорытындыларды зерттеу

Біз Excel электрондық кестесінде жоғарыда келтірілген дөңгелектелген деректерден регрессия теңдеуін «жинақтаймыз»:

SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

Неғұрлым таныс математикалық түрде оны келесідей жазуға болады:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

«МММ» АҚ деректері кестеде берілген:

Оларды регрессия теңдеуіне ауыстырсақ, біз 64,72 миллион АҚШ долларын аламыз. Бұл «ММММ» АҚ акцияларын сатып алуға тұрарлық емес дегенді білдіреді, өйткені олардың құны 70 миллион АҚШ доллары айтарлықтай көтерілген.

Көріп отырғаныңыздай, Excel электрондық кесте процессорын және регрессия теңдеуін пайдалану өте нақты транзакцияның орындылығына қатысты негізделген шешім қабылдауға мүмкіндік берді.

Енді сіз регрессияның не екенін білесіз. Жоғарыда қарастырылған Excel мысалдары эконометрика саласындағы практикалық есептерді шешуге көмектеседі.

Регрессиялық талдау

Регрессия (сызықтық) талдау- бір немесе бірнеше тәуелсіз айнымалылардың тәуелді айнымалыға әсерін зерттеуге арналған статистикалық әдіс. Басқаша тәуелсіз айнымалылар регрессорлар немесе болжаушылар деп аталады, ал тәуелді айнымалылар шартты айнымалылар деп аталады. Терминология тәуелдіЖәне тәуелсізайнымалылар тек айнымалылардың математикалық тәуелділігін көрсетеді ( жалған корреляцияны қараңыз), себеп-салдар байланыстарынан гөрі.

Регрессиялық талдаудың мақсаттары

  1. Критерийдің (тәуелді) айнымалының болжауыштар (тәуелсіз айнымалылар) бойынша вариациясын анықтау дәрежесін анықтау
  2. Тәуелсіз айнымалы(лар) арқылы тәуелді айнымалының мәнін болжау
  3. Тәуелді айнымалының вариациясына жеке тәуелсіз айнымалылардың үлесін анықтау

Регрессиялық талдауды айнымалылар арасында байланыстың бар-жоғын анықтау үшін пайдалану мүмкін емес, өйткені мұндай қатынастың болуы талдауды қолданудың міндетті шарты болып табылады.

Регрессияның математикалық анықтамасы

Қатаң регрессиялық қатынасты келесідей анықтауға болады. , берілген ықтималдық үлестірімі бар кездейсоқ шама болсын. Егер мәндердің әрбір жиынтығы үшін шартты математикалық күту анықталса

(жалпы түрдегі регрессия теңдеуі),

содан кейін функция шақырылады регрессиямәндері бойынша Y мәндері, ал оның графигі болады регрессия сызығыарқылы, немесе регрессия теңдеуі.

Тәуелділік Y орташа мәндерінің өзгеруімен көрінеді. Мәндердің әрбір тіркелген жиыны үшін мән белгілі бір шашыраумен кездейсоқ шама болып қалады.

Регрессиялық талдау өзгерген кезде Y өзгерісін қаншалықты дәл бағалайды деген сұрақты нақтылау үшін әртүрлі мәндер жиыны үшін Y дисперсиясының орташа мәні пайдаланылады (шын мәнінде біз тәуелді айнымалының дисперсиясының өлшемі туралы айтып отырмыз. регрессия сызығының айналасында).

Ең кіші квадраттар әдісі (коэффициенттерді есептеу)

Тәжірибеде регрессия сызығы көбінесе қажетті қисыққа жақындататын сызықтық функция (сызықтық регрессия) түрінде ізделеді. Бұл ең кіші квадраттар әдісін қолдану арқылы, нақты бақыланатындардың олардың бағалауларынан квадраттық ауытқуларының қосындысы минимизацияланған кезде орындалады (қажетті регрессия қатынасын көрсететін түзу сызықты қолданатын бағалауды білдіреді):

(M – үлгі өлшемі). Бұл тәсіл жоғарыда келтірілген өрнекте көрсетілген сома дәл болған жағдайда ең аз мәнді алатыны белгілі фактіге негізделген.

Ең кіші квадраттар әдісін қолданып регрессиялық талдау мәселесін шешу үшін тұжырымдама енгізілген қалдық функциялар:

Қалдық функцияның минималды шарты:

Алынған жүйе белгісіздері бар сызықтық теңдеулер жүйесі

Теңдеулердің сол жағындағы бос мүшелерді матрица түрінде көрсетсек

ал оң жағындағы белгісіздер үшін коэффициенттер матрица болып табылады

онда матрицалық теңдеуді аламыз: , ол Гаусс әдісімен оңай шешіледі. Алынған матрица регрессия сызығының теңдеуінің коэффициенттерін қамтитын матрица болады:

Ең жақсы бағаларды алу үшін OLS (Гаусс-Марков шарттары) алғышарттарын орындау қажет. Ағылшын әдебиетінде мұндай бағалаулар BLUE (Best Linear Unbiased Estimators) деп аталады.

Регрессия параметрлерін интерпретациялау

Параметрлер – ішінара корреляция коэффициенттері; Қалған болжаушылардың ықпалын бекіту арқылы түсіндірілетін Y дисперсиясының үлесі ретінде түсіндіріледі, яғни Y түсіндіруге жеке үлесті өлшейді. Корреляциялық болжаушылар жағдайында бағалаулардағы белгісіздік мәселесі туындайды, олар болжаушылардың модельге енгізілген ретіне тәуелді болады. Мұндай жағдайларда корреляциялық және сатылы регрессиялық талдау әдістерін қолдану қажет.

Регрессиялық талдаудың сызықты емес модельдері туралы айтқанда, тәуелсіз айнымалылардағы сызықтық емес (формальды тұрғыдан алғанда, сызықтық регрессияға оңай төмендетілген) немесе бағаланған параметрлердегі сызықтық еместілік туралы (елеулі есептеу қиындықтары). Бірінші типтегі сызықтық емес жағдайда, мазмұндық тұрғыдан алғанда, , пішінінің терминдерінің үлгісіндегі сыртқы түрін ерекшелеу маңызды, , сипаттамалар арасындағы өзара әрекеттесулердің болуын көрсетеді , т.б. (Мультиколлинеарлықты қараңыз).

Сондай-ақ қараңыз

Сілтемелер

  • www.kgafk.ru - «Регрессиялық талдау» тақырыбы бойынша дәріс
  • www.basegroup.ru – регрессиялық модельдердегі айнымалыларды таңдау әдістері

Әдебиет

  • Норман Дрейпер, Гарри СмитҚолданбалы регрессиялық талдау. Бірнеше регрессия = Қолданбалы регрессия талдауы. - 3-ші басылым. - М.: «Диалектика», 2007. - 912 б. - ISBN 0-471-17082-8
  • Статистикалық модельдерді бағалаудың сенімді әдістері: Монография. - Қ.: ПП «Санпарел», 2005. - 504-б. - ISBN 966-96574-0-7, ӘОЖ: 519.237.5:515.126.2, ББК 22.172+22.152
  • Радченко Станислав Григорьевич,Регрессиялық талдау әдістемесі: Монография. - Қ.: «Корныйчук», 2011. - 376-б. - ISBN 978-966-7599-72-0

Викимедиа қоры.