Адукацыя, Навука

Рэгрэсія лагістычная: мадэль і метады

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. Метады лагістычнай рэгрэсіі і дискриминантного аналізу выкарыстоўваюцца тады, калі неабходна дакладна дыферэнцыраваць рэспандэнтаў па мэтавым катэгорыям. Пры гэтым самі групы прадстаўлены ўзроўнямі аднаго аднаварыянтнай параметру. а также выясним, для чего она нужна. Разгледзім далей падрабязна мадэль лагістычнай рэгрэсіі, а таксама высвятлім, для чаго яна патрэбна.

Агульныя звесткі

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Прыкладам задачы, у вырашэнні якой выкарыстоўваецца рэгрэсія лагістычная, можа выступаць класіфікацыя рэспандэнтаў па групах якія купляюць і ня купляюць гарчыцу. Дыферэнцыяцыя ажыццяўляецца ў адпаведнасці з сацыяльна-дэмаграфічнымі характарыстыкамі. Да іх, у прыватнасці, адносяць ўзрост, падлогу, колькасць сваякоў, даходы і пр. У аперацыях прысутнічаюць крытэрыі дыферэнцыяцыі і зменная. Апошняя кадуе мэтавыя катэгорыі, на якія, уласна, трэба падзяліць рэспандэнтаў.

нюансы

, значительно уже, чем для дискриминантного анализа. Варта сказаць, што спектр выпадкаў, у якіх ужываецца рэгрэсія лагістычная, значна ўжо, чым для дискриминантного аналізу. У гэтай сувязі выкарыстанне апошняга як універсальнага спосабу дыферэнцыяцыі лічыцца больш пераважнай. Больш за тое, эксперты рэкамендуюць пачынаць класіфікацыйныя даследаванні з дискриминантного аналізу. І толькі ў выпадку няўпэўненасці за вынікі можна выкарыстоўваць лагістычную рэгрэсію. Такая неабходнасць абумоўліваецца некаторымі фактарамі. используется при наличии четкого представления о типе независимых и зависимых переменных. Рэгрэсія лагістычная выкарыстоўваецца пры наяўнасці дакладнага ўяўлення пра тып незалежных і залежных зменных. У адпаведнасці з гэтым выбіраецца адна з 3-х магчымых працэдур. Пры дискриминантном аналізе даследчык заўсёды мае справу з адной статычнай аперацыяй. У ёй удзельнічае адна залежная і некалькі незалежных катэгарыяльных зменных са шкалой любога тыпу.

віды

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Задача статыстычнага даследавання, у якім выкарыстоўваецца рэгрэсія лагістычная, складаецца ў вызначэнні верагоднасці таго, што пэўны рэспандэнт будзе аднесены да той ці іншай групе. Дыферэнцыяцыя ажыццяўляецца па пэўных параметрах. На практыцы, у адпаведнасці са значэннямі аднаго альбо некалькіх незалежных фактараў, можна класіфікаваць рэспандэнтаў па дзвюх групах. . У гэтым выпадку мае месца бінарная лагістычная рэгрэсія. Таксама зададзеныя параметры могуць выкарыстоўвацца пры размеркаванні на групы, якіх больш за два. У такой сітуацыі мае месца мультиномиальная лагістычная рэгрэсія. Атрыманыя групы выяўленыя ўзроўнямі нейкай адной зменнай.

прыклад

Дапусцім, ёсць адказы рэспандэнтаў на пытанне аб тым, ці цікава ім прапанову аб набыцці зямельнага ўчастка ў прыгарадзе Масквы. Пры гэтым дадзеныя варыянты "не" і "так". Неабходна высветліць, якія менавіта фактары аказваюць пераважнае ўплыў на рашэнне патэнцыйных пакупнікоў. Для гэтага апытваным задаюцца пытанні аб інфраструктуры тэрыторыі, адлегласці да сталіцы, плошчы ўчастка, наяўнасці / адсутнасці жылога збудаванні і пр. Выкарыстоўваючы бінарную рэгрэсію, можна размеркаваць рэспандэнтаў па дзвюх групах. У першую будуць уваходзіць тыя, хто зацікаўлены ў набыцці - патэнцыйныя пакупнікі, а ў другую, адпаведна, тыя, каго такую прапанову не цікавіць. Для кожнага рэспандэнта, акрамя таго, будзе разлічана верагоднасць аднясення да той ці іншай катэгорыі.

параўнальная характарыстыка

Адрозненне ад двух варыянтаў, названых вышэй, складаецца ў розным ліку груп і тыпе залежных і незалежных зменных. У бінарнай рэгрэсіі, напрыклад, вывучаецца залежнасць дихотомического фактару ад аднаго ці некалькіх незалежных умоў. Пры гэтым апошнія могуць мець любы тып шкалы. Мультиноминальная рэгрэсія лічыцца разнавіднасцю гэтага варыянту класіфікацыі. У ёй да залежнай пераменнай ставіцца больш 2-х груп. Незалежныя фактары павінны мець альбо парадкавым, альбо намінальны шкалу.

Лагістычная рэгрэсія ў spss

У статыстычным пакеце 11-12 быў уведзены новы варыянт аналізу - парадкавы. Гэты метад выкарыстоўваецца ў выпадку, калі залежны фактар ставіцца да аднайменнай (парадкавай) шкале. Пры гэтым незалежныя зменныя выбіраюцца аднаго пэўнага тыпу. Яны павінны быць або парадкавымі, або намінальнымі. Класіфікацыя па некалькіх катэгорыям лічыцца найбольш універсальнай. Гэты спосаб можа выкарыстоўвацца ва ўсіх даследаваннях, у якіх ужываецца лагістычная рэгрэсія. , однако, можно только с помощью всех трех приемов. Павысіць якасць мадэлі, аднак, можна толькі з дапамогай усіх трох прыёмаў.

Парадкавая класіфікацыя

Варта сказаць, што раней у статыстычным пакеце не была прадугледжана тыпавая магчымасць выканання спецыялізаванага аналізу для залежных фактараў з парадкавай шкалой. Для ўсіх зменных з колькасцю груп больш за 2-х выкарыстоўваўся мультиноминальный варыянт. Уведзены адносна нядаўна парадкавы аналіз валодае побач асаблівасцяў. Яны ўлічваюць менавіта спецыфіку шкалы. часто не рассматривается как отдельный прием. Між тым у метадычных дапаможніках парадкавая лагістычная рэгрэсія часта не разглядаецца як асобны прыём. Абумоўлена гэта наступным: парадкавы аналіз не валодае якімі-небудзь значнымі перавагамі перад мультиноминальным. Даследчык цалкам можа выкарыстаць апошні пры наяўнасці і парадкавай, і намінальным залежнай пераменнай. Пры гэтым самі працэсы класіфікацыі амаль не адрозніваюцца адзін ад аднаго. Гэта азначае, што правядзенне парадкавага аналізу не выкліча якіх-небудзь складанасцяў.

варыянт аналізу

Разгледзім просты выпадак - бінарную рэгрэсію. Дапусцім, у працэсе маркетынгавага даследавання ацэньваецца запатрабаванасць выпускнікоў пэўнага сталічнай ВНУ. У анкеце рэспандэнтам прапанаваны пытанні, у ліку якіх:

З'яўляецеся Ці вы працуюць? (Ql).
Пакажыце год заканчэння ВНУ (q 21).
Які сярэдні выпускны бал (aver).
Пол (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Лагістычная рэгрэсія дазволіць ацаніць ўздзеянне незалежных фактараў aver, q 21 і q 22 на зменную ql. Прасцей кажучы, мэтай аналізу будзе вызначэнне верагоднага працаўладкавання выпускнікоў на падставе звестак аб поле, годе заканчэння і сярэдняга бала.

Logistic Regression

Каб задаць параметры з дапамогай бінарнай рэгрэсіі, варта скарыстацца меню Analyze►Regression►Binary Logistic. У акне Logistic Regression трэба абраць у левым спісе даступных зменных залежны фактар. Ім з'яўляецца ql. Гэтую зменную трэба змясціць у поле Dependent. Пасля гэтага на ўчастак Covariates неабходна ўвесці незалежныя фактары - q 21, q 22, aver. Затым трэба выбраць спосаб іх уключэння ў аналіз. Калі колькасць незалежных фактараў больш 2-х, выкарыстоўваецца не метад адначасовага ўвядзення ўсіх зменных, які ўсталяваны па змаўчанні, а пакрокавы. Самым папулярным спосабам лічыцца Backward: LR. Выкарыстоўваючы кнопку Select, можна ўключыць у даследаванне не ўсіх рэспандэнтаў, а толькі канкрэтную мэтавую катэгорыю.

Define Categorical Variables

Кнопку Categorical трэба выкарыстоўваць у тым выпадку, калі адной з незалежных зменных з'яўляецца намінальная з колькасцю катэгорый больш за 2-х. У гэтай сітуацыі ў акне Define Categorical Variables на ўчастак Categorical Covariates змяшчаецца менавіта такі параметр. У разгляданым прыкладзе такая пераменная адсутнічае. Пасля гэтага ў які расчыняецца спісе Contrast варта абраць пункт Deviation і націснуць кнопку Change. У выніку з кожнага намінальнага фактару будзе сфарміравана некалькі залежных зменных. Іх колькасць адпавядае ліку катэгорый зыходнага ўмовы.

Save New Variables

З дапамогай кнопкі Save у асноўным дыялогавым акне даследаванні задаецца стварэнне новых параметраў. Яны будуць утрымліваць паказчыкі, разлічаныя ў працэсе рэгрэсіі. У прыватнасці, можна стварыць зменныя, якімі вызначаюцца:

Прыналежнасць да канкрэтнай катэгорыі класіфікацыі (Groupmembership).
Верагоднасць аднясення рэспандэнта ў кожную доследную групу (Probabilities).

Пры выкарыстанні кнопкі Options даследчык не атрымлівае якіх-небудзь істотных магчымасцяў. Адпаведна, яе можна ігнараваць. Пасля націску кнопкі "Ок" у асноўным акне будуць выведзены вынікі аналізу.

Праверка якасці адэкватнымі лагістычнай рэгрэсіі

Разгледзім табліцу Omnibus Testsof Model Coefficients. У ёй адлюстроўваюцца вынікі аналізу якасці набліжэння мадэлі. У сувязі з тым, што было зададзена пакрокавы варыянт, трэба глядзець вынікі апошняга этапу (Step2). Станоўчым будзе лічыцца такі вынік, пры якім выяўляецца павелічэнне паказчыка Chi-square пры пераходзе на наступную стадыю пры высокай ступені значнасці (Sig. <0,05). Якасць мадэлі ацэньваецца ў радку Model. Калі атрымана адмоўная велічыня, але яна не разглядаецца як значная пры агульнай высокай істотнасці мадэлі, апошнюю можна прызнаць практычна прыдатнай.

табліцы

Model Summary дае магчымасць ацаніць паказчык сукупнай дысперсіі, якую апісвае пабудаваная мадэль (паказчык R Square). Рэкамендуецца ўжываць велічыню Nagelker. Станоўчым паказчыкам можна лічыць параметр Nagelkerke R Square, калі ён вышэй 0.50. Пасля гэтага ацэньваюцца вынікі класіфікацыі, у якой сапраўдныя паказчыкі прыналежнасці да той ці іншай доследнай катэгорыі параўноўваюцца з прадказанай на аснове Рэгрэсійная мадэлі. Для гэтага выкарыстоўваецца табліца Classification Table. Яна таксама дазваляе зрабіць высновы пра карэктнасць дыферэнцыяцыі для кожнай разгляданай групы. . Наступная табліца дае магчымасць высветліць статыстычную значнасць незалежных фактараў, уведзеных у аналіз, а таксама кожны нестандартизированный каэфіцыент лагістычнай рэгрэсіі. На падставе гэтых паказчыкаў можна спрагназаваць прыналежнасць кожнага рэспандэнта ў выбарцы да канкрэтнай групе. З дапамогай кнопкі Save можна ўвесці новыя зменныя. У іх будуць змяшчацца звесткi аб прыналежнасці да канкрэтнай класіфікацыйнай катэгорыі (Predictedcategory) і верагоднасць ўключэння ў гэтыя групы (Predicted probabilities membership). Пасля націску "Ок" у асноўным акне Multinomial Logistic Regression з'явяцца вынікі разлікаў.

Першая табліца, у якой прысутнічаюць важныя для даследчыка паказчыкі, - Model Fitting Information. Высокі ўзровень статыстычнай значнасці будзе паказваць на высокую якасць і прыдатнасць выкарыстання мадэлі пры рашэнні практычных задач. Яшчэ адной значнай табліцай з'яўляецца Pseudo R-Square. Яна дазваляе ацаніць долю агульнай дысперсіі ў залежным фактары, якая абумоўліваецца незалежнымі зменнымі, абранымі для аналізу. Па табліцы Likelihood Ratio Tests можна зрабіць высновы аб статыстычнай значнасці апошніх. У Parameter Estimates адбіваюцца нестандартизированные каэфіцыенты. Яны выкарыстоўваюцца пры пабудове ўраўненні. Акрамя гэтага, для кожнага спалучэння зменных вызначана статыстычная значнасць іх уздзеяння на залежны фактар. Між тым у маркетынгавых даследаваннях часцяком узнікае неабходнасць дыферэнцаваць па катэгорыях рэспандэнтаў не паасобку, а ў складзе мэтавай групы. Для гэтага выкарыстоўваецца табліца Observedand Predicted Frequencies.

практычнае прымяненне

Разгледжаны спосаб аналізу шырока выкарыстоўваецца ў працы трэйдараў. У 1991 г. быў распрацаваны індыкатар лагістычнай сігмападобнай рэгрэсіі. Ён уяўляе сабой просты ў эксплуатацыі і эфектыўны інструмент, з дапамогай якога можна спрагназаваць верагодныя цэны да іх "перагрэву". Індыкатар прадстаўлены на графіцы ў выглядзе канала, утворанага двума лініямі, якія праходзяць паралельна. Яны выдаленыя на роўнае адлегласць ад трэнду. Шырыня калідора будзе залежаць выключна ад таймфрейме. Індыкатар выкарыстоўваецца пры працы амаль з усімі актывамі - ад валютных пар да каштоўных металаў.

На практыцы выпрацавана 2 ключавыя стратэгіі прымянення інструмента: на прабой і на разварот. У апошнім выпадку трэйдар будзе арыентавацца на дынаміку цэнавага змены ў межах канала. Па меры набліжэння кошту да лініі падтрымкі або супраціву стаўка робіцца на верагоднасць таго, што рух пачнецца ў зваротным кірунку. Калі кошт ўшчыльную падыдзе да верхняй мяжы, то ад актыву можна пазбавіцца. Калі ж яна знаходзіцца ў ніжняй мяжы, то варта задумацца аб набыцці. Стратэгія на прабой мяркуе ўжыванне ордэраў. Яны ўсталёўваюцца за межамі межаў на адносна невялікім выдаленні. Прымаючы пад увагу, што кошт у шэрагу выпадкаў парушае іх на непрацяглы час, варта перастрахавацца і ўсталяваць стоп-лоссы. Пры гэтым, зразумела, незалежна ад абранай стратэгіі трэйдару неабходна максімальна стрымана ўспрымаць і ацэньваць сітуацыю, узніклую на рынку.

заключэнне

Такім чынам, прымяненне лагістычнай рэгрэсіі дазваляе хутка і проста класіфікаваць рэспандэнтаў на катэгорыі ў адпаведнасці з зададзенымі параметрамі. Пры аналізе можна выкарыстоўваць якой-небудзь пэўны спосаб. У прыватнасці, універсальнасцю адрозніваецца мультиноминальная рэгрэсія. Аднак спецыялісты рэкамендуюць ужываць усе апісаныя вышэй спосабы ў комплексе. Гэта абумоўліваецца тым, што ў такім выпадку якасць мадэлі будзе істотна вышэй. Гэта, у сваю чаргу, пашырыць спектр яе прымянення.

Адукацыя, Навука

Рэгрэсія лагістычная: мадэль і метады

Агульныя звесткі

нюансы

віды

прыклад

параўнальная характарыстыка

Лагістычная рэгрэсія ў spss

Парадкавая класіфікацыя

варыянт аналізу

Logistic Regression

Define Categorical Variables

Save New Variables

Праверка якасці адэкватнымі лагістычнай рэгрэсіі

табліцы

практычнае прымяненне

заключэнне

Similar articles

Адукацыя

Адукацыя

Адукацыя

Адукацыя

Адукацыя

Адукацыя

Trending Now

Ежа і напоі

Аўтамабілі

Мастацтва і забавы

Ежа і напоі

Здароўе

Хатні ўтульнасць

Newest

Навіны і грамадства

Прыгажосць

Хатні ўтульнасць

Здароўе

Тэхналогіі

Аўтамабілі