Analiza Regresji ó jest to metoda statystyczna, badania, pozwalający pokazać zależność tego parametru od jednej lub kilku zmiennych niezależnych. W докомпьютерную erę jego zastosowanie było dość trudne, zwłaszcza jeśli chodziło o dużych ilościach danych. Dzisiaj, aby dowiedzieć się jak zbudować regresji w programie Excel, można rozwiązywać złożone statystyczne zadania dosłownie za kilka minut. Poniżej podane są konkretne przykłady z obszaru gospodarki.
Samo to pojęcie zostało wprowadzone do matematyki przez Francisa Гальтоном w 1886 roku. Regresja бывает:
Rozważmy zadanie określenia zależności ilości уволившихся członków zespołu od przeciętnego wynagrodzenia w 6 zakładach przemysłowych.
Zadanie. W sześciu zakładach analizowali среднемесячную wynagrodzenia i liczby pracowników odchodzących na własną prośbę. W formie tabelarycznej mamy:
A | B | C | |
1 | X | Liczba уволившихся | Wynagrodzenie |
2 | Y | 30000 rubli | |
3 | 1 | 60 | 35000 zł |
4 | 2 | 35 | 40000 rubli |
5 | 3 | 20 | 45000 zł |
6 | 4 | 20 | 50000 rubli |
7 | 5 | 15 | 55000 zł |
8 | 6 | 15 | 60000 rubli |
Dla zadania określenia zależności ilości уволившихся pracowników od przeciętnego wynagrodzenia w 6 zakładach model regresji ma postać równania Y = a0 + a1X1 +…+aKXK, gdzie xI " wpływ zmienne, aI – współczynniki regresji, a k ó liczba czynników.
Do tego zadania Y ó wskaźnik уволившихся pracowników, a wpływ czynnik ó pensja, którą oznaczamy X.
Analizy regresji w programie Excel musi poprzedzać zastosowanie do istniejących widokiem tabeli danych wbudowanych funkcji. Jednak do tych celów lepiej skorzystać z bardzo użyteczny dodatek «Pakiet analysis». Aby go uaktywnić należy:
Bardziej:
Siódma wersja systemu Windows od momentu jej wyjścia przedstawił użytkownikom wiele niespodzianek. Tak, wielu odkryli w systemie (a dokładniej w «Menedżerze urządzeń») sterownik do karty tunelowania Teredo firmy Microsoft. Co to jest jasn...
Co to jest Ethernet – główne zalety internetu-sieci
O tym, co to jest Ethernet, okazało się w latach siedemdziesiątych XX wieku. Wynalazł ten typ sieci lokalnej Robert Metcalfe, który pracował w tym czasie na firmy Xerox. W latach 70-tych Metcalf otworzył własną firmę 3com, gdzie zakończyła się opraco...
UAC: wyłączyć lub ułaskawienie
W odległej już od nas w 2006 roku światowa komputerowa opinia publiczna była wstrząsa wyjściem SYSTEMU Windows Vista. Na nowy system od razu runął niesamowity lawinę negatywnych, powód dla którego nadal zostały.Jednym z nich była opcja UAC, wyłączyć ...
Jeśli wszystko jest zrobione poprawnie, w prawej części zakładki «Dane», położony jest nad arkuszem roboczym «do pliku programu excel», pojawi się odpowiedni przycisk.
Teraz, gdy pod ręką ma wszystkie niezbędne wirtualne narzędzia do wykonywania obliczeń ekonometrycznych, możemy przystąpić do rozwiązania naszego zadania. Do tego:
W rezultacie, program automatycznie wypełni nowy arkusz matrycy, procesora danymi analizy regresji. Uwaga! W programie Excel istnieje możliwość samodzielnie określić miejsce, które wolisz do tego celu. Może to być na przykład ten sam arkusz, w którym znajdują się wartości Y i X, lub nawet nowa książka, specjalnie przeznaczony do przechowywania tych danych.
W programie Excel dane uzyskane w trakcie przetwarzania danych widzianego przykład mają wygląd:
Przede wszystkim, należy zwrócić uwagę na wartość R-kwadrat. Jest to współczynnik determinacji. W tym przykładzie R-kwadrat = 0,755 (75,5%), czyli szacowane parametry modelu wyjaśniają zależność między omawianymi parametrami na 75,5 %. Im wyższa wartość współczynnika determinacji, tym wybrany model jest bardziej odpowiedniej dla konkretnego zadania. Uważa się, że jest poprawnie opisuje rzeczywistą sytuację przy wartości R-kwadrat powyżej 0,8. Jeśli R-kwadrat<0,5, to taka analizy regresji w programie Excel nie można uznać za słuszne.
Liczba 64,1428 pokazuje, jaka będzie wartość Y, gdy wszystkie zmienne xi w badanym modelu wyzerują się. Innymi słowy można stwierdzić, że na wartość analizowanego parametru mają wpływ i inne czynniki, które nie są opisane w modelu.
Następny współczynnik -0,16285 znajduje się w komórce B18, pokazuje doniosłość wpływu zmiennej X na Y. oznacza To, że przeciętne miesięczne wynagrodzenie pracowników w obrębie rozpatrywanego modelu wpływa na liczbę уволившихся z wagą -0,16285, czyli stopień jejskutki bardzo mała. Znak ó-» wskazuje na to, że współczynnik ma wartość ujemną. To oczywiste, tak jak zawsze wiadomo, że im więcej wynagrodzenie w przedsiębiorstwie, tym mniej ludzi wyrażają pragnienie, aby rozwiązać umowy o pracę lub rezygnuje z pracy.
Pod tym pojęciem rozumie się równanie związku z wieloma niezależnymi zmiennymi rodzaju:
Y=f(x1+x2+…xM) + ε gdzie y ó to wynik cecha (zmienna zależna), a x1, x2, …xM – są to znaki-czynniki (zmienne niezależne).
Dla szpiczaka regresji (MR) ją sprawują, stosując metodę najmniejszych kwadratów (OLS). Dla równań liniowych w postaci Y = a + b1X1 +…+bMXM+ ε budujemy układ równań normalnych (patrz poniżej)
Aby zrozumieć zasadę metody, rozważmy двухфакторный przypadek. Wtedy mamy sytuację, opisanych w rozdziale wzoru
Stąd otrzymujemy:
Gdzie σ ó to dyspersja odpowiedniej cechy, odbitego w indeksie.
OLS ma zastosowanie do równania PANIE w стандартизируемом skali. W takim przypadku otrzymujemy równanie:
W którym tY, tXO1, …TXmO " стандартизируемые zmienne, dla których wartości średnie są równe 0; βI – standaryzowane współczynniki regresji, a odchylenie standardowe ó 1.
Należy pamiętać, że wszystkie βIO W tym przypadku określono, jak нормируемые i централизируемые, więc ich porównywanie między sobą jest poprawne i dopuszczalne. Ponadto, podjęta wykonywać pokazy czynników, odrzucając te z nich, u których najmniejsze wartości βi.
Załóżmy, że istnieje tabela głośniki ceny konkretnego towaru N w ciągu ostatnich 8 miesięcy. Należy podjąć decyzję o celowości zakupu jego partii w cenie 1850 zł/t.
A | B | C | |
1 | Miesiąc | Nazwa miesiąca | Cena towaru N |
2 | 1 | Styczeń | 1750 rubli za tonę |
3 | 2 | Luty | 1755 zł za tonę |
4 | 3 | Marzec | 1767 zł za tonę |
5 | 4 | Kwiecień | 1760 zł za tonę |
6 | 5 | Maj | 1770 zł za tonę |
7 | 6 | Czerwiec | 1790 zł za tonę |
8 | 7 | Lipiec | 1810 zł za tonę |
9 | 8 | Sierpień | 1840 zł za tonę |
W Celu rozwiązania tego zadania w tabeli procesor ów do pliku programu excel» należy włączyć już znany z przedstawionego powyżej przykład instrument óAnaliza danych». Dalej wybierają punkt óRegresja» i określają parametry. Trzeba pamiętać, że w polu „Wejście interwał Y» powinien być podawany zakres wartości dla zmiennej zależnej (w tym przypadku ceny towarów w określonych miesiącach roku), a w «Wejście odstęp X» ó dla niepodległej (numer miesiąca). Potwierdzamy czynności, naciskając «Ok”. W nowym arkuszu (jeżeli tak zaznaczono), otrzymujemy dane do regresji.
Budujemy na nim liniowe równanie postaci y=ax+b, gdzie jako parametry a i b występują współczynniki wiersza z nazwą pokoje miesiące i kursy i wiersze «Y-przecięcie» z arkusza z wynikami analizy regresji. W ten sposób, liniowe równanie regresji (UR) dla zadania 3 jest zapisywany w postaci:
Cena towaru N = 11,714* numer miesiąca + 1727,54.
Lub algebraicznych w opisach
Y = 11,714 x + 1727,54
Aby zdecydować, właściwie czy otrzymane równania regresji liniowej, są używane współczynniki szpiczaka korelacji (KMC) i determinacji, a także kryterium Fishera i kryterium t-Studenta. W tabeli «do pliku programu excel» z wynikami regresji występują pod nazwami wielokrotnego R, R-kwadrat, F-statystyki t-statystyki, odpowiednio.
KMC R daje możliwość oceny ciasne вероятностной związku między niezależnej i zależnej zmiennymi. Jej wysoka wartość świadczy o dość silnej więzi między zmiennymi «Numer miesiąca» i «Cena towaru N w euro za 1 tonę». Jednak charakter tego związku pozostaje nieznany.
Kwadrat współczynnika determinacji R2(RI) jest numeryczną charakterystykę udziału w ogólnej scatter i pokazuje, jaki rozrzut części danych doświadczalnych, tj. wartości zależnejzmiennej jest obliczana zgodnie z równaniem regresji liniowej. W danym zadaniu ta wartość wynosi 84,8%, tj. dane statystyczne z dużą dokładnością opisuje otrzymanym UR.
Statystyka F, zwana również kryterium Fishera, służy do oceny znaczenia liniowej zależności podważyć lub potwierdzić hipotezę o jej istnieniu.
Wartość statystyki t (kryterium Studenta) pomaga ocenić znaczenie współczynnika przy nieznanej albo wolnego członka liniowej zależności. Jeśli wartość t-kryterium > tZł, to hipoteza o незначимости wolnego członka liniowego równania odrzucone.
W danym zadaniu dla wolnego członka za pomocą narzędzi «do pliku programu excel» otrzymano, że t=169,20903, a p=2,89 E-12, czyli mamy zerowy prawdopodobieństwo, że zostanie odrzucona pewna hipoteza o незначимости wolnego członka. Aby współczynnik przy niewiadomej t=5,79405, a p=0,001158. Innymi słowy prawdopodobieństwo, że zostanie odrzucona pewna hipoteza o незначимости współczynnik przy niewiadomej wynosi 0,12%.
W Ten sposób, można stwierdzić, że otrzymane równanie regresji liniowej odpowiednio.
Wielokrotna regresja w programie Excel jest wykonywane przy użyciu tego samego narzędzia, «Analiza danych». Rozważmy konkretny stosować zadanie.
Podręcznik firma «NNN» musi podjąć decyzję o celowości zakupu 20 % pakietu akcji AO «MMM». Cena pakietu (SP) wynosi 70 mln dolarów amerykańskich. Specjalistami «NNN» zebrane dane o podobnych transakcjach. Zdecydowano się oceniać wartość pakietu akcji na podstawie takich parametrów, wyrażone w milionach dolarów amerykańskich, jak:
Ponadto, jest opcja zadłużenia przedsiębiorstwa wynagrodzenia (V3 N) w tysiącach dolarów amerykańskich.
Przede wszystkim, należy sporządzić tabelę danych źródłowych. Ona ma następującą postać:
Dalej:
- Podkreślają element óNowy arkusz» i kliknij «Ok”.
Dostają analiza regresji dla danego zadania.
«Zbiera» z zaokrąglonych danych przedstawionych wyżej na arkuszu matrycy, procesora Excel, równanie regresji:
SP = 0,103*SOF + 0,541*VO ó 0,031*VK +0,405*VD +0,691*VZP ó 265,844.
W bardziej rygorystyczny matematycznej postaci można go nagrać, jak:
Y = 0,103*x1 + 0,541*x2 ó 0,031*x3 +0,405*x4 +0,691*x5 ó 265,844
Dane do AO «MMM» przedstawione są w tabeli:
SOF, USD | VO, USD | VK, USD | VD, USD | VZP, USD | SP, USD |
102,5 | 535,5 | 45,2 | 41,5 | 21,55 | 64,72 |
Po Wprowadzeniu ich do równania regresji, otrzymują cyfrę w 64,72 mln dolarów amerykańskich. To znaczy, że akcje AO «MMM» nie warto kupować, ponieważ ich cena w 70 mln dolarów amerykańskich dość zawyżone.
Jak widać, korzystanie z tabelarycznego cpu «do pliku programu excel» i równania regresji pozwoliło podjąć świadomą decyzję co do celowości dość konkretnej transakcji.
Teraz już wiesz, co to jest regresja. Przykłady w programie Excel, omówionych powyżej, pomogą ci w rozwiązywaniu zadań praktycznych z zakresu ekonometrii.
Article in other languages:
AR: https://tostpost.com/ar/computers/1904-excel.html
En: https://tostpost.com/computers/9019-regression-in-excel-equation-examples-linear-regression.html
Alin Trodden - autor artykułu, redaktor
"Cześć, jestem Alin Trodden. Piszę teksty, czytam książki, Szukam wrażeń. I nie jestem zły w opowiadaniu ci o tym. Zawsze chętnie biorę udział w ciekawych projektach."
Nowości
Co to jest 25 rama i czy można z jego pomocą schudnąć?
Wiadomo wiele sposobów, aby zresetować wstrętni zbędne kilogramy. Najbardziej popularnymi z nich są specjalne ćwiczenia i diety kompleksy. Pierwsze zawierają w sobie zestaw ćwiczeń, które pozwalają wzmocnić napięcie mięśni obszaró...
Jak sformatować dysk w komputerze
Podczas pracy komputera często pojawiają się różnego rodzaju błędy, które nie zawsze można rozwiązać środkami przywracania systemu, czasem trzeba uciekać się do drastycznych środków, takich jak, sformatować dysk twardy. Także, jeś...
Jakie podjąć działania, jeśli nie włącza się laptop?
Przenośny komputer ó asystent i przyjaciel dla wielu współczesnych ludzi. Czasami przestaje działać, w tym przypadku należy zwrócić się do specjalistów w serwis. Czy można przeprowadzić samodzielną diagnostykę, aby zrozumie...
Każdy bardziej lub mniej aktywny użytkownik internetu w ogóle, a sieci prywatnych w szczególności słyszałem słowo «ava». Ale tutaj jest problem: co ono oznacza i z czym go jeść, nikt nie wyjaśnia. W rzeczywistości, wsz...
Kod błędu e fail 0x80004005 i rozwiązanie tego problemu
W niektórych przypadkach można zobaczyć kod błędu e fail 0x80004005. Ten błąd występuje podczas próby uruchomienia maszyny wirtualnej za pomocą programu Oracle VirtualBox.Przyczynyzazwyczaj kod błędu e fail 0x80004005 można zobacz...
Legion Commander Dota 2: hyde, funkcje przejścia i zalecenia
«Dota 2» stale się rozwija, co wpływa na miłość fanów gry na równi z obecnością dużego wyboru bohaterów, strategii i artefaktów. Z każdym wydaniem aktualizacji zmianie ulegają niektóre postacie, i to powoduje problemy ...
Uwaga (0)
Ten artykuł nie ma komentarzy, bądź pierwszy!