Кездейсоқ шамалар арасындағы корреляция. Кездейсоқ шамалардың корреляциясы

Терминнің тікелей анықтамасы корреляция - стохастикалық, ықтимал, мүмкін байланыс екі (жұпталған) немесе бірнеше (бірнеше) кездейсоқ шама арасында.

Жоғарыда айтылғандай, егер екі SV үшін ( XЖәне Ы) теңдік сақталады P(XY) =P(X) P(Y), содан кейін шамалар XЖәне Ытәуелсіз болып саналады. Ал, бұлай болмаса ше!?

Өйткені, сұрақ әрқашан маңызды - және қаншабір SV екіншісіне тәуелді ме? Мәселе мынада, адамдарда міндетті түрде сандық өлшемде бір нәрсені талдауға құлшынысы жоқ. Жүйелік талдау үздіксіз есептеулерді білдіретіні, компьютерді пайдалану бізді жұмыс істеуге мәжбүр ететіні қазірдің өзінде түсінікті сандар, ұғымдар емес.

Екі кездейсоқ шама арасындағы ықтимал байланысты сандық бағалау үшін: Ы(орташа М жС ж) Және - X(орташа Mxжәне стандартты ауытқу S x) деп аталатынды қолдану әдетке айналған корреляция коэффициенті

R xy = . {2 - 11}

Бұл коэффициент осы кездейсоқ шамалардың арасындағы байланыстың жақындығына байланысты -1-ден +1-ге дейінгі мәндерді қабылдауы мүмкін.

Егер корреляция коэффициенті нөлге тең болса, онда XЖәне Ышақырды корреляциясыз . Әдетте оларды тәуелсіз деп санауға ешқандай себеп жоқ - әдетте, шамалардың сызықтық емес қатынастары бар екені белгілі болды. R xy = 0, дегенмен шамалар бір-біріне тәуелді. Керісінше әрқашан дұрыс – шамалар болса тәуелсіз , Бұл Rxy = 0 . Бірақ егер модуль Rxy= 1, яғни қатысуын болжауға толық негіз бар сызықтықарасындағы байланыстар ЫЖәне X. Сондықтан олар жиі айтады сызықтық корреляция SV арасындағы байланысты бағалаудың осы әдісін қолдану кезінде.

Екі арасындағы корреляцияны бағалаудың тағы бір әдісін атап өтейік кездейсоқ айнымалылар- егер олардың әрқайсысының орташа мәнінен ауытқуының көбейтіндісін шығарсақ, онда алынған мән

xy = S (X - M x) арқылы· (Ж - М ж)

немесе ковариация мөлшерлері XЖәне Ыкорреляция коэффициентінен екі көрсеткішті ажыратады : Біріншіден, орташалау(бақылаулар немесе жұптар санына бөлінеді X, Ы) және екіншіден, нормалаусәйкес стандартты ауытқуларға бөлу арқылы.

Күрделі жүйедегі кездейсоқ шамалардың арасындағы байланыстарды мұндай бағалау мыналардың бірі болып табылады бастапқы кезеңдеріжүйелік талдау, демек, бұл жерде екі SV арасындағы байланыстың бар немесе жоқтығы туралы қорытындыға сенім мәселесі оның барлық ауырлығында туындайды.

IN заманауи әдістержүйелік талдау әдетте мұны жасайды. Табылған мән бойынша РКөмекші шаманы есептеңіз:

W = 0,5 Ln[(1 + R)/(1-R)]{2 - 12}

ал корреляция коэффициентіне сенімділік мәселесі стандартты кестелер немесе формулалар арқылы анықталатын W кездейсоқ шамасының сенімділік интервалдарына дейін төмендейді.

IN кейбір жағдайлардажүйелік талдау үшін бірнеше (2-ден көп) кездейсоқ шама арасындағы байланыс мәселесін немесе көп корреляция.

Болсын X, ЫЖәне З- байқаулар негізінде олардың орташа мәндерін белгілеген кездейсоқ шамалар Mx, М ж,Мзжәне стандартты ауытқулар S x, S y , S z .

Сонда таба аласыз еселейді корреляция коэффициенттері Rxy, Рхз, Рызжоғарыдағы формула бойынша. Бірақ бұл жеткіліксіз - ақыр соңында, үш кезеңнің әрқайсысында біз үшінші кездейсоқ шаманың болуын ұмытып кеттік! Сондықтан көп корреляциялық талдау жағдайында кейде деп аталатынды іздеу қажет. жеке корреляция коэффициенттері - мысалы, тербеліс бағалауы Зарасындағы байланыс туралы XЖәне Ыкоэффициенті арқылы жасалады

Rxy.z = {2 - 13}

Ақырында, біз сұрақ қоя аламыз - бұл SV мен басқалардың жиынтығы арасында қандай байланыс бар? Мұндай сұрақтарға жауап коэффициенттер арқылы беріледі бірнеше корреляциялар R x.yz, R y.zx, R z.xy,оларды есептеу формулалары бірдей принциптерге негізделген - шамалардың бірінің жиынтықтағы барлық қалғандарымен байланысын ескере отырып.

Барлық сипатталған корреляциялық көрсеткіштерді есептеудің күрделілігіне көп көңіл бөлудің қажеті жоқ - оларды есептеуге арналған бағдарламалар өте қарапайым және қазіргі заманғы компьютерлердің көптеген PPP құрылғыларында дайын.

Ең бастысын түсіну жеткілікті – егер күрделі жүйенің элементін формальды түрде сипаттау кезінде ішкі жүйе түріндегі осындай элементтердің жиынтығы немесе, сайып келгенде, тұтас жүйе деп қарастырамыз. коммуникациялар оның жеке бөліктері арасында, содан кейін бір СВ-ның екіншісіне әсер ету түріндегі бұл байланыстың жақындық дәрежесі корреляция деңгейінде бағалануы мүмкін және бағалануы керек.

Қорытындылай келе, біз тағы бір нәрсені атап өтеміз - корреляция деңгейінде жүйелік талдаудың барлық жағдайларында жұптық корреляциядағы кездейсоқ шамалардың екеуі де немесе көп корреляциядағы барлығы да «тең» болып саналады - яғни. туралы айтып отырмызО өзара ықпал ету CB бір-бірінің үстіне.

Бұл әрдайым бола бермейді - өте жиі сұрақ байланыстар туралы ЫЖәне Xбасқа жазықтықта орналасады – шамалардың бірі екіншісіне тәуелді (функция) (аргумент).

Корреляциялық талдаудың мақсатыкейбір нақты процесті сипаттайтын кездейсоқ шамалар (мүмкіндіктер) арасындағы байланыстың беріктігін бағалауды анықтау болып табылады.
Корреляциялық талдаудың мәселелері:
а) Екі немесе одан да көп құбылыстардың үйлесімділік дәрежесін (жақындығы, күші, ауырлығы, қарқындылығы) өлшеу.
б) Құбылыстар арасындағы байланыс дәрежесін өлшеуге негізделген, пайда болған атрибутқа ең маңызды әсер ететін факторларды таңдау. Осы аспектіде маңызды факторлар одан әрі регрессиялық талдауда қолданылады.
в) Белгісіз себепті байланыстарды анықтау.

Қарым-қатынастардың көріну формалары өте алуан түрлі. Ең көп таралған түрлері функционалды (толық) және корреляциялық (толық емес) байланыс.
Корреляциямассалық бақылаулар үшін орта есеппен пайда болады, қашан берілген мәндертәуелді айнымалы тәуелсіз айнымалының ықтималдық мәндерінің белгілі қатарына сәйкес келеді. Қарым-қатынас корреляция деп аталады, егер факторлық сипаттаманың әрбір мәні нәтижелік сипаттаманың нақты анықталған кездейсоқ емес мәніне сәйкес келсе.
Корреляциялық кестенің көрнекі көрінісі корреляция өрісі болып табылады. Бұл абсцисса осінде X мәндері, ордината осінде Y мәндері және нүктелердің орналасуы бойынша X және Y комбинациясы нүктелермен көрсетілген график байланыстың.
Байланыстың жақындық көрсеткіштерінәтижелі белгінің вариациясының факторлық белгінің вариациясына тәуелділігін сипаттауға мүмкіндік береді.
Толыптау дәрежесінің неғұрлым жетілдірілген көрсеткіші корреляциялық байланысболып табылады сызықтық корреляция коэффициенті. Бұл көрсеткішті есептеу кезінде сипаттаманың жеке мәндерінің орташа мәннен ауытқуы ғана емес, сонымен бірге осы ауытқулардың өте шамасы да ескеріледі.

Бұл тақырыптың негізгі сұрақтары тиімді сипаттама мен түсіндірмелі айнымалы арасындағы регрессиялық қатынастың теңдеулері, регрессия моделінің параметрлерін бағалаудың ең кіші квадраттар әдісі, алынған регрессия теңдеуінің сапасын талдау, болжау үшін сенімділік интервалдарын құру болып табылады. регрессия теңдеуінің көмегімен тиімді сипаттаманың мәндері.

2-мысал


Қалыпты теңдеулер жүйесі.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Біздің деректеріміз үшін теңдеулер жүйесі пішінге ие
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
Бірінші теңдеуден өрнектейміз Ажәне екінші теңдеуге ауыстырыңыз:
Біз b = -3,46, a = 1379,33 аламыз
Регрессия теңдеуі:
у = -3,46 x + 1379,33

2. Регрессия теңдеуінің параметрлерін есептеу.
Үлгі білдіреді.



Үлгі ауытқулар:


Стандартты ауытқу


1.1. Корреляция коэффициенті
Ковариация.

Байланыстың жақындық көрсеткішін есептейміз. Бұл көрсеткіш үлгілік сызықтық корреляция коэффициенті болып табылады, ол формула бойынша есептеледі:

Сызықтық корреляция коэффициенті –1-ден +1-ге дейінгі мәндерді қабылдайды.
Сипаттамалар арасындағы байланыстар әлсіз және күшті (жақын) болуы мүмкін. Олардың критерийлері Чаддок шкаласы бойынша бағаланады:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Біздің мысалда Y белгісі мен X факторы арасындағы байланыс жоғары және кері.
Сонымен қатар сызықтық жұп корреляция коэффициентін b регрессия коэффициенті арқылы анықтауға болады:

1.2. Регрессия теңдеуі(регрессия теңдеуін бағалау).

Сызықтық регрессия теңдеуі у = -3,46 x + 1379,33

b = -3,46 коэффициенті оның өлшем бірлігіне х факторының мәнінің жоғарылауы немесе төмендеуімен тиімді көрсеткіштің орташа өзгерісін (у өлшем бірліктерімен) көрсетеді. IN бұл мысалда 1 бірлікке ұлғайған кезде у орта есеппен -3,46 төмендейді.
a = 1379,33 коэффициенті формальды түрде болжанған y деңгейін көрсетеді, бірақ тек x = 0 таңдамалы мәндерге жақын болған жағдайда ғана.
Бірақ егер x=0 x үлгі мәндерінен алыс болса, онда сөзбе-сөз интерпретация қате нәтижелерге әкелуі мүмкін, тіпті егер регрессия сызығы байқалған таңдамалы мәндерді жеткілікті дәл сипаттаса да, бұл да болатынына кепілдік жоқ. солға немесе оңға экстраполяциялау кезіндегі жағдай.
Регрессия теңдеуіне сәйкес x мәндерін ауыстыру арқылы біз әрбір бақылау үшін y(x) өнімділік көрсеткішінің тураланған (болжамды) мәндерін анықтай аламыз.
y және x арасындағы байланыс b регрессия коэффициентінің белгісін анықтайды (егер > 0 – тікелей қатынас, әйтпесе – кері). Біздің мысалда байланыс кері.
1.3. Серпімділік коэффициенті.
Нәтижелік сипаттамаға факторлардың әсерін тікелей бағалау үшін регрессия коэффициенттерін (b мысалында) пайдалану ұсынылмайды, егер нәтиже көрсеткіші y және факторлық сипаттама x өлшем бірліктерінің айырмашылығы болса.
Осы мақсаттар үшін икемділік коэффициенттері мен бета коэффициенттері есептеледі.
Орташа икемділік коэффициенті Е нәтиженің жиынтықта орта есеппен қанша пайызға өзгеретінін көрсетеді сағфактор өзгерген кезде оның орташа мәнінен xоның орташа мәнінен 1%-ға.
Серпімділік коэффициенті мына формула бойынша табылады:


Серпімділік коэффициенті 1-ден аз. Сондықтан Х 1%-ға өзгерсе, Y 1%-дан аз өзгереді. Басқаша айтқанда, Х-тің Y-ге әсері айтарлықтай емес.
Бета коэффициентіоның орташа мәнінің қай бөлігімен көрсетеді шаршы ауытқуфакторлық сипаттама тұрақты деңгейде бекітілген қалған тәуелсіз айнымалылар мәнімен оның стандартты ауытқуы мәніне өзгергенде, нәтиже сипаттаманың орташа мәні өзгереді:

Сол. стандартты ауытқу бойынша х ұлғаюы S x орташа мәнінің Y 0,74 стандартты ауытқу S y төмендеуіне әкеледі.
1.4. Жақындау қатесі.
Регрессия теңдеуінің сапасын абсолютті жуықтау қатесі арқылы бағалайық. Жақындаудың орташа қатесі – есептелген мәндердің нақты мәндерден орташа ауытқуы:


Қателік 15%-дан аз болғандықтан, бұл теңдеуді регрессия ретінде пайдалануға болады.
Дисперсиялық талдау.
Дисперсияны талдаудың мақсаты тәуелді айнымалының дисперсиясын талдау болып табылады:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
Қайда
∑(y i - y cp) 2 - квадраттық ауытқулардың жалпы сомасы;
∑(y(x) - y cp) 2 - регрессияға байланысты квадраттық ауытқулар сомасы («түсіндірілді» немесе «факторлық»);
∑(y - y(x)) 2 - квадраттық ауытқулардың қалдық қосындысы.
Теориялық корреляциялық байланысүшін сызықтық байланыс r xy корреляция коэффициентіне тең.
Тәуелдiлiктiң кез келген нысаны үшiн байланыстың тығыздығы арқылы анықталады көп корреляция коэффициенті:

Бұл коэффициент әмбебап болып табылады, өйткені ол байланыстың жақындығын және модельдің дәлдігін көрсетеді, сонымен қатар айнымалылар арасындағы байланыстың кез келген нысаны үшін қолданылуы мүмкін. Бір факторлы корреляция моделін құру кезінде еселік корреляция коэффициенті r xy жұптық корреляция коэффициентіне тең.
1.6. Анықтау коэффициенті.
(Көптік) корреляция коэффициентінің квадраты фактор атрибутының вариациясымен түсіндірілетін нәтижелік атрибуттағы вариацияның үлесін көрсететін детерминация коэффициенті деп аталады.
Көбінесе детерминация коэффициентін түсіндіргенде ол пайызбен көрсетіледі.
R2 = -0,742 = 0,5413
сол. 54,13% жағдайда х өзгерістері у өзгерістеріне әкеледі. Басқаша айтқанда, регрессия теңдеуін таңдау дәлдігі орташа. Y өзгерісінің қалған 45,87% модельде ескерілмеген факторлармен түсіндіріледі.

Анықтамалар

  1. Эконометрика: Оқулық / Ред. I.I. Елисеева. – М.: Қаржы және статистика, 2001, б. 34...89.
  2. Магнус Ю.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Бастауыш курсы. Оқулық. – 2-ші басылым, рев. – М.: Дело, 1998, б. 17..42.
  3. Эконометрика бойынша практикум: Прок. жәрдемақы / I.I. Елисеева, С.В. Курышева, Н.М. Гордеенко және басқалар; Ред. I.I. Елисеева. – М.: Қаржы және статистика, 2001, б. 5..48.

Әртүрлі табиғаттағы кездейсоқ шамалар арасында, мысалы, Х мәні мен Y шамасының арасында болатын байланыс міндетті түрде бір мәннің екіншісіне тікелей тәуелділігінің салдары болып табылмайды (деп аталатын функционалдық байланыс). Кейбір жағдайларда екі шама да екі шамаға ортақ әртүрлі факторлардың тұтас жиынтығына тәуелді, нәтижесінде бір-бірімен байланысты заңдылықтар қалыптасады. Кездейсоқ шамалар арасындағы байланыс статистиканы қолдану арқылы ашылғанда, біз параметрлердің үздіксіз өзгеруінің себебін аштық деп айта алмаймыз, біз тек өзара байланысты екі нәтижені көрдік;

Мысалы, американдық экшн фильмдерін теледидардан жиі көретін балалар аз оқиды. Көп оқитын балалар жақсы оқиды. Себептер мен салдарлардың қайда екенін анықтау оңай емес, бірақ бұл статистиканың міндеті емес. Статистика тек байланыстың бар екендігі туралы гипотезаны алға тартып, оны сандармен растай алады. Егер шынымен байланыс болса, екі кездейсоқ шама өзара байланысқан деп аталады. Бір кездейсоқ шаманың өсуі екінші кездейсоқ шаманың ұлғаюымен байланысты болса, корреляция тікелей деп аталады. Мысалы, бір жылда оқылған беттер саны және орташа балл (академиялық үлгерім). Егер, керісінше, бір мәннің өсуі екіншісінің төмендеуімен байланысты болса, біз кері корреляция туралы айтамыз. Мысалы, экшн фильмдерінің саны мен оқылған беттер саны.

Екі кездейсоқ шаманың өзара байланысы корреляциялық талдау деп аталады, мұндай байланыстың болуын анықтауға және бұл байланыстың қаншалықты жақын және маңызды екенін бағалауға мүмкіндік береді; Мұның бәрі сандық түрде көрсетіледі.

Шамалар арасында корреляция бар-жоғын қалай анықтауға болады? Көп жағдайда мұны кәдімгі диаграммадан көруге болады. Мысалы, біздің үлгідегі әрбір бала үшін біз X i (беттер саны) және Y i (жылдық бағалаудың орташа балл) мәнін анықтай аламыз және бұл деректерді кесте түрінде жаза аламыз. X және Y осьтерін тұрғызыңыз, содан кейін олардың әрқайсысында біздің кестеден белгілі бір координаталар жұбы (X i, Y i) болатындай етіп графиктегі нүктелердің барлық қатарын салыңыз. Бұл жағдайда бізге не себеп және қандай салдар деп санауға болатынын анықтау қиынға соғатындықтан, қай ось тік және қандай көлденең болатыны маңызды емес.


Егер график а) сияқты көрінсе, онда бұл тікелей корреляцияның болуын көрсетеді, егер ол b) сияқты көрінсе, онда корреляция кері болады. Корреляция жоқ
Корреляция коэффициентін пайдаланып, мәндер арасындағы қатынас қаншалықты жақын екенін есептей аласыз.

Өнімге баға мен сұраныс арасында корреляция болсын. Әртүрлі сатушылардан бағаға байланысты сатып алынған бірліктердің саны кестеде көрсетілген:

Біз кері корреляциямен айналысып жатқанымызды көруге болады. Байланыстың жақындығын сандық анықтау үшін корреляция коэффициенті қолданылады:

Excel бағдарламасында r коэффициентін f x функциясын, содан кейін статистикалық функцияларды, CORREL функциясын қолданып есептейміз. Бағдарламаның шақыруында тінтуірдің көмегімен екі түрлі массивтерді (X және Y) сәйкес екі өріске енгізіңіз. Біздің жағдайда корреляция коэффициенті r = - 0,988 болып шықты. Айта кету керек, корреляция коэффициенті 0-ге жақын болған сайын шамалар арасындағы байланыс соғұрлым әлсіз болады. Тікелей корреляциямен ең жақын байланыс +1-ге жақын r коэффициентіне сәйкес келеді. Біздің жағдайда корреляция кері, бірақ сонымен бірге өте жақын, ал коэффициент -1-ге жақын.

Коэффиценті аралық мәнге ие кездейсоқ шамалар туралы не айтуға болады? Мысалы, егер r=0,65 болса. Бұл жағдайда статистика екі кездейсоқ шама бір-бірімен ішінара байланысты деп айтуға мүмкіндік береді. Сатып алулар санына 65% әсер етті делікбағасы, ал 35%-ға - басқа жағдайлар.

Және тағы бір маңызды жағдайды атап өту керек. Кездейсоқ айнымалылар туралы айтып отырғандықтан, біз байқаған байланыс кездейсоқ жағдай болуы мүмкін. Сонымен қатар, жоқ жерде қосылымды табу ықтималдығы, әсіресе, іріктеуде ұпайлар аз болған кезде жоғары болады, және бағалау кезінде сіз графикті құрмайсыз, тек компьютерде корреляция коэффициентінің мәнін есептедіңіз. Екеуін ғана қалдырсақ әртүрлі нүктелеркез келген кездейсоқ таңдауда корреляция коэффициенті +1 немесе -1 болады. Мектептегі геометрия курсынан біз әрқашан екі нүкте арқылы түзу жүргізуге болатынын білеміз. Бағалау үшінстатистикалық маңыздылығы

Сіз тапқан байланыс фактісі үшін корреляциялық түзетуді қолдану пайдалы: Корреляциялық талдаудың мақсаты берілген кездейсоқ шамалардың өзара байланыстылығын анықтау болса, мақсатрегрессиялық талдау

- аналитикалық тәуелділікпен осы байланысты сипаттаңыз, яғни. теңдеуді қолдану. Графиктегі нүктелер арасындағы байланысты түзу сызықпен көрсетуге болатын қарапайым жағдайды қарастырамыз. Бұл түзудің теңдеуі Y=aX+b, мұндағы a=Yaverage-bXaverage,

Сондай-ақ, b және r формулаларын салыстыру коэффициентінің сызықтың көлбеуінің мәнін бермейтінін, тек қосылымның бар екендігінің нақты фактісін көрсететінін ескеріңіз.

Кәсіпорында 10 адам жұмыс істейді. 2-кестеде олардың жұмыс тәжірибесі туралы деректер және

айлық жалақы.

Осы мәліметтерді пайдаланып есептеңіз

  • - таңдамалы ковариантты бағалаудың мәні;
  • - іріктеудің Пирсон корреляция коэффициентінің мәні;
  • - алынған мәндерден байланыстың бағыты мен беріктігін бағалау;
  • - бұл компанияның жапондық менеджмент үлгісін қолданады деп айту қаншалықты заңды екенін анықтаңыз, ол қызметкер берілген компанияда неғұрлым көп уақыт өткізсе, оның жалақысы соғұрлым жоғары болуы керек деп есептейді.

Корреляция өрісіне сүйене отырып, біз (популяция үшін) X және Y барлық мүмкін мәндерінің арасындағы байланыс сызықтық деп болжауға болады.

Регрессия параметрлерін есептеу үшін біз есептеу кестесін құрастырамыз.

Үлгі білдіреді.

Үлгі ауытқулар:

Болжалды регрессия теңдеуі болады

y = bx + a + e,

мұндағы ei - ei, a және b қателерінің байқалатын мәндері (бағалары), сәйкесінше b параметрлерінің бағалаулары және табылуы тиіс регрессия моделіндегі.

b және c параметрлерін бағалау үшін ең кіші квадраттар әдісі (ең кіші квадраттар әдісі) қолданылады.

Қалыпты теңдеулер жүйесі.

a?x + b?x2 = ?y*x

Біздің деректеріміз үшін теңдеулер жүйесі пішінге ие

  • 10a + 307 b = 33300
  • 307 a + 10857 b = 1127700

Жүйенің (1) теңдеуін (-30,7) көбейтейік, алгебралық қосу әдісі арқылы шешетін жүйені аламыз.

  • -307а -9424,9 б = -1022310
  • 307 a + 10857 b = 1127700

Біз аламыз:

1432,1 b = 105390

b = 73,5912 қайдан келеді?

Енді (1) теңдеуден «a» коэффициентін табайық:

  • 10a + 307 b = 33300
  • 10a + 307 * 73,5912 = 33300
  • 10а = 10707,49

Эмпирикалық регрессия коэффициенттерін аламыз: b = 73,5912, a = 1070,7492

Регрессия теңдеуі (эмпирикалық регрессия теңдеуі):

у = 73,5912 x + 1070,7492

Ковариация.

Біздің мысалда Y белгісі мен X факторы арасындағы байланыс жоғары және тікелей.

Сондықтан, қызметкер белгілі бір компанияда неғұрлым көп жұмыс істесе, оның жалақысы соғұрлым жоғары болады деп сенімді түрде айта аламыз.

4. Тексеріңіз статистикалық гипотезалар. Бұл мәселені шешу кезінде бірінші қадам – тексерілетін гипотезаны және балама нұсқасын тұжырымдау.

Жалпы акциялардың теңдігін тексеру.

Екі факультетте студенттердің үлгеріміне зерттеу жүргізілді. Опциялардың нәтижелері 3-кестеде келтірілген. Екі факультетте де үздік студенттердің пайызы бірдей деуге бола ма?

Қарапайым арифметикалық орташа

Біз жалпы үлестердің теңдігі туралы гипотезаны тексереміз:

Студенттік критерийдің эксперименттік мәнін табайық:

Еркіндік дәрежелерінің саны

f = nх + ну - 2 = 2 + 2 - 2 = 2

Студенттік үлестіру кестесін пайдаланып tkp мәнін анықтаңыз

Студенттік кестені пайдалана отырып, біз табамыз:

Кесте(f;b/2) = Ткесте(2;0,025) = 4,303

b = 0,05 мәнділік деңгейінде және берілген еркіндік дәрежелеріндегі Студенттік үлестірімнің критикалық нүктелерінің кестесін пайдалана отырып, біз tcr = 4,303 табамыз.

Өйткені tob > tcr болса, онда нөлдік гипотеза жоққа шығарылады, екі үлгінің жалпы үлестері тең емес.

Жалпы таралудың біркелкілігін тексеру.

Университет басшылары гуманитарлық кафедраның танымалдылығы уақыт өте қалай өзгергенін білгісі келеді. Осы факультетке түсуге өтініш берген талапкерлердің жалпы санына қатысты талдау жасалды. сәйкес жыл. (Деректер 4-кестеде келтірілген). Өтініш берушілер санын репрезентативті үлгі деп санасақ жалпы саныжылдың мектеп түлектері, мектеп оқушыларының бұл факультет мамандықтарына деген қызығушылығы уақыт өткен сайын өзгермейді деуге бола ма?

4-нұсқа

Шешуі: Көрсеткіштерді есептеу кестесі.

Аралықтың ортасы, xi

Жинақталған жиілік, S

Жиілік, fi/n

Тарату қатарын бағалау үшін келесі көрсеткіштерді табамыз:

Орташа өлшенген

Вариация диапазоны - бұл бастапқы серия сипаттамасының ең үлкен және ең аз мәндерінің арасындағы айырмашылық.

R = 2008 - 1988 = 20 Дисперсия - оның орташа мәнінің айналасындағы дисперсия өлшемін сипаттайды (дисперсиялық өлшем, яғни орташадан ауытқу).

Стандартты ауытқу (орташа іріктеу қатесі).

Серияның әрбір мәні 2002,66 орташа мәннен 6,32 орташа айырмашылығы бар.

Популяцияның біркелкі таралуы туралы гипотезаны тексеру.

Х-тің біркелкі таралуы туралы гипотезаны тексеру үшін, яғни. заң бойынша: f(x) = 1/(b-a) (a,b) интервалында қажет:

a және b параметрлерін бағалаңыз - интервалдың соңы мүмкін мәндер X, формулаларға сәйкес (* белгісі параметрді бағалауды білдіреді):

Күтілетін үлестірімнің ықтималдық тығыздығын табыңыз f(x) = 1/(b* - a*)

Теориялық жиіліктерді табыңыз:

n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)

n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

ns = n*1/(b* - a*)*(b* - xs-1)

k = s-3 еркіндік дәрежесінің санын алып, Пирсон критерийі бойынша эмпирикалық және теориялық жиіліктерді салыстырыңыз, мұндағы s – бастапқы іріктеу интервалдарының саны; егер шағын жиіліктердің комбинациясы, демек интервалдардың өзі орындалса, онда s - комбинациядан кейін қалған интервалдар саны. Формулалар арқылы біркелкі үлестірудің a* және b* параметрлері үшін бағалауларды табайық:

Болжалды біркелкі үлестірудің тығыздығын табайық:

f(x) = 1/(b* - a*) = 1/(2013,62 - 1991,71) = 0,0456

Теориялық жиіліктерді табайық:

n1 = n*f(x)(x1 - a*) = 0,77 * 0,0456(1992-1991,71) = 0,0102

n5 = n*f(x)(b* - x4) = 0,77 * 0,0456(2013,62-2008) = 0,2

ns = n*f(x)(xi - xi-1)

Пирсон статистикасы эмпирикалық және теориялық үлестірім арасындағы айырмашылықты өлшейтіндіктен, оның байқалатын мәні Коб неғұрлым көп болса, соғұрлым негізгі гипотезаға қарсы дәлел күштірек болады.

Сондықтан, бұл статистика үшін маңызды аймақ әрқашан оң жақта :)