Regressionsanalyse ä diese statistische Methode der Forschung, zulassend, zeigen die Abhängigkeit eines Parameters von einer oder mehreren unabhängigen Variablen. In докомпьютерную Zeitalter seine Anwendung war ziemlich schwierig sein, besonders wenn die Rede von großen Datenmengen. Heute lernen wie eine Regression in Excel können Sie komplexe statistische Aufgabe in nur wenigen Minuten. Nachfolgend finden Sie konkrete Beispiele aus dem Bereich der Wirtschaft.
Dieses Konzept wurde eingeführt in der Mathematik Francis Galton 1886. Regression бывает:
Betrachten Sie die Aufgabe der Bestimmung der Abhängigkeit der Anzahl der Ruhestand der Mitglieder des Kollektivs des Durchschnittslohns auf 6 Industrieunternehmen.
Aufgabe. In den sechs analysierten Unternehmen среднемесячную die Löhne und die Zahl der Mitarbeiter, die auf eigenen Wunsch verlassen haben. In der tabellarischen Form haben:
A | B | C | |
1 | X | Die Anzahl der Ruhestand | Gehalt |
2 | Y | 30000 Euro | |
3 | 1 | 60 | 35000 Euro |
4 | 2 | 35 | 40000 Rubel |
5 | 3 | 20 | 45000 Rubel |
6 | 4 | 20 | 50000 Euro |
7 | 5 | 15 | 55000 Rubel |
8 | 6 | 15 | 60000 Euro |
Für die Aufgabe der Bestimmung der Abhängigkeit der Anzahl der Ruhestand des Durchschnittslohns der Arbeitnehmer an 6 Unternehmen Regressionsmodell hat die Form der Gleichung Y = a0 + a1X1 +…+aKXK, xI ä die Einfluss-Variablen, aI — Regressionskoeffizienten, a k ä Anzahl der Faktoren.
Für diese Aufgabe Y — dies ist ein Indikator Ruhestand Mitarbeiter und Einfluss Faktor " das Gehalt, das bezeichnen X.
Analyse der Regression in Excel sollte vor der Anwendung auf den vorliegenden tabellarischen Daten der integrierten Funktionen. Aber für diese Zwecke besser nutzen sehr nützliche add-in „Paket-Analyse». Um es zu aktivieren, müssen Sie:
Mehr:
Lenovo v580c: eine detaillierte übersicht über
Heute haben wir beschlossen, zu schreiben über den Laptop Lenovo v580c. Übersicht ausführliche, da dieser tragbare PC IdeaPad-Serie hat eine hohe Popularität, aber viele Menschen wissen nicht, was zieht das Gerät der Käufer. Das Modell ist schnell un...
Wie löschen Sie den Cache Ihres Computers (Browser)
Sehr oft im Internet finden Sie die Frage: „Wie Cache leeren Computer?». Diese Formulierung gibt ein user-Neuling, der irgendwo gehört, dass die Art und Weise kann die Arbeit des Computers zu verbessern, aber nicht ganz versteht, worüber ...
Muss mit bedauern zugeben, dass der Fortschritt in der informatik-und Multimedia-Technologien neben den offensichtlichen Vorteilen hat eine Reihe von negativen Eigenschaften. Zum Beispiel, als vor einigen Jahren die Anbieter zu einem vernünftigen Pre...
Wenn alles richtig gemacht wurde, im rechten Teil der Registerkarte „Daten», das sich über einem Blatt „Excel», erscheint die gewünschte Schaltfläche.
Nun, wenn die Hand hat alle notwendigen virtuellen Instrumente für die Umsetzung ökonometrische Berechnungen, können Sie beginnen, zur Lösung unseres Problems. Um dies zu tun:
In der Folge füllt das Programm automatisch ein neues Blatt tabellarischen CPU-Daten Regressionsanalyse. Bitte beachten Sie! In Excel gibt es die Möglichkeit, den Ort, die Sie bevorzugen für diesen Zweck. Dies kann beispielsweise dasselbe Blatt, wo sind die Werte von Y und X, oder sogar ein neues Buch, speziell entwickelt, um gleichartige Daten zu speichern.
In Excel die Daten, die im Zuge der Bearbeitung der betrachteten Beispiel haben die Form:
Vor allem bitte beachten Sie die Bedeutung der R-Quadrat. Er stellt den determinationskoeffizienten. In diesem Beispiel R-Quadrat = 0,755 (75,5%), d.h. die berechneten Parameter des Modells erklären die Abhängigkeit zwischen den betrachteten Parametern auf 75,5 %. Je höher der Wert des Koeffizienten der determination, damit das ausgewählte Modell gilt als anwendbar für eine bestimmte Aufgabe. Es wird angenommen, dass es korrekt beschreibt die Reale Situation bei einem Wert von R-Quadrat höher als 0,8. Wenn R-Quadrat<0,5, dann ist dies eine Regressionsanalyse in Excel nicht als glaubhaft.
Die Anzahl der 64,1428 zeigt, welchen Wert Y, wenn alle Variablen xi in der betrachteten Modelle auf null zurückgesetzt. Mit anderen Worten kann man behaupten, dass der Wert der analysierten Parameter einen Einfluss und andere Faktoren, nicht die in ein bestimmtes Modell.
Das Folgende Verhältnis -0,16285, gelegen in der Zelle B18, zeigt die Gewichtung der Einfluss der Variablen X auf Y. Dies bedeutet, dass der Durchschnittliche Gehalt der Mitarbeiter innerhalb des betrachteten Modells wirkt sich auf die Anzahl der Ruhestand mit dem Gewicht -0,16285, d.h. der Grad derder Einfluss ist ziemlich klein. Zeichen «-» weist darauf hin, dass der Koeffizient einen negativen Wert hat. Dies ist offensichtlich, da jeder weiß, dass je mehr Gehalt im Unternehmen, desto weniger Menschen äußern den Wunsch, den Arbeitsvertrag oder das Unternehmen verlässt.
Unter diesem Begriff versteht man eine Gleichung Zusammenhang mit mehreren unabhängigen Variablen-Arten:
Y=f(x1+x2+ xM) + ε, wobei y — es ist effektiver Merkmal (abhängige Variable) und x1, x2, …xM — diese Merkmale-Faktoren (unabhängige Variablen).
Für die multiple Regression (MR) durchgeführt, unter Verwendung der Methode der kleinsten Quadrate (OLS). Für lineare Gleichungen der Art Y = a + b1X1 +…+bMXM+ ε bauen das System der normalen-Gleichungen (siehe unten)
Das Prinzip der Methode Zu verstehen, betrachten wir den Faktor der Fall. Dann haben wir die Situation, beschriebene Formel
Daraus folgt:
Wo σ ä ist die Varianz des Merkmals, reflektierten im index.
OLS gilt für die Gleichung in MR стандартизируемом Maßstab. In diesem Fall erhalten wir die Gleichung:
In dem tY, tX1, …TXm ä стандартизируемые Variablen, deren Mittelwerte gleich 0; βI — standardisierte Regressionskoeffizienten und Standardabweichung ä 1.
Bitte beachten Sie, dass alle βI In diesem Fall definiert als normierte und централизируемые, so dass deren Vergleich untereinander gilt als korrekt und gültig. Darüber hinaus akzeptiert die Durchführung der screenings Faktoren, verwerfen diejenigen, bei denen die kleinsten Werte βi.
Angenommen, eine Tabelle der Dynamik der Preise einer bestimmten Ware N in den letzten 8 Monaten. Muss eine Entscheidung über die Zweckmäßigkeit des Erwerbs seiner Partei zum Preis von 1850 Rbl./T.
A | B | C | |
1 | Nummer des Monats | Monatsname | Der Preis der Ware N |
2 | 1 | Januar | 1750 Euro pro Tonne |
3 | 2 | Januar | 1755 Rubel pro Tonne |
4 | 3 | März | 1767 Rubel pro Tonne |
5 | 4 | April | 1760 Euro pro Tonne |
6 | 5 | Mai | 1770 Euro pro Tonne |
7 | 6 | Juni | 1790 Euro pro Tonne |
8 | 7 | Juli | 1810 Euro pro Tonne |
9 | 8 | August | 1840 Rubel pro Tonne |
Für die Lösung dieser Aufgabe im Tabellenkalkulationsprogramm „Excel» erforderlich erschließen, bereits bekannt aus der oben aufgeführten Beispiel das Tool „Datenanalyse». Als Nächstes wählen Abschnitt „Regression» und stellen Sie die Parameter. Wir müssen Bedenken, dass im Feld „Eingabe-Intervall Y» eingegeben werden muss Wertebereich für die abhängige Variable (in diesem Fall die Preise für die Ware in bestimmte Monaten des Jahres), und in „Eingabe-Intervall X» ä, für eine unabhängige (Zahl des Monats). Bestätigen die Aktion durch drücken der „Ok“. Neues Blatt (wenn so angegeben) erhalten wir die Daten für die Regression.
Bauen auf Ihnen eine lineare Gleichung der Art y=ax+b, wobei als Parameter a und b treten die Koeffizienten der Zeile mit der Bezeichnung Nummer des Monats und die Koeffizienten und die Zeilen „Y-Kreuzung» aus dem Blatt mit den Ergebnissen der Regressionsanalyse. So, die lineare Regressionsgleichung (UR) für die Aufgabe 3 wird in der Form von:
Der Preis für die Ware N = 11,714* Zahl des Monats + 1727,54.
Oder in algebraischer Notation
Y = 11,714 x + 1727,54
Um zu entscheiden, ob entsprechend die resultierende Gleichung der linearen Regression werden die Koeffizienten der multiplen Korrelation (KMK) und determination sowie die Fisher-Kriterium und das Kriterium der Student. In Tabelle „Excel» mit den Ergebnissen der Regression treten Sie unter dem Namen multiples R, R-Quadrat, F-Statistik und t-Statistik entsprechend.
KMK R ermöglicht die Beurteilung der überbelegung wahrscheinlichen Zusammenhang zwischen der unabhängigen und abhängigen Variablen. Ihr hoher Wert zeugt von einem ausreichend starken Zusammenhang zwischen den Variablen „Nummer des Monats“ und „der Preis der Ware N in Rubel pro 1 Tonne». Aber die Natur dieser Beziehung ist unbekannt.
Das Quadrat des Pearsonschen Korrelationskoeffizienten R2(RI) ist eine numerische Eigenschaft Anteil der gesamten Streuung und zeigt, welcher Teil der Streuung der experimentellen Daten, d.h. die Werte der abhängigendie Variable entspricht der Gleichung der linearen Regression. In der betrachteten Aufgabe dieser Wert beträgt 84,8%, d.h. die statistischen Daten mit einem hohen Maß an Präzision beschreibt die erhaltenen UR.
Die F-Statistik, der sogenannte Fisher-Kriterium wird zur Bewertung der Signifikanz einer linearen Abhängigkeit, widerlegen oder Bekräftigung der Hypothese von seiner Existenz.
Der Wert der t-Statistik (Student-Kriterium) hilft beurteilen die Bedeutung des Faktors bei unbekannten oder Mitglied der freien Linear abhängig. Wenn der Wert des t-Tests > tCR, dann ist die Hypothese des незначимости Mitglied einer freien linearen Gleichungen abgelehnt.
In dieser Aufgabe für Free member durch Instrumente „Excel» empfangen wurde, dass t=169,20903 und p=2,89 E-12, d.h. wir haben null-die Wahrscheinlichkeit, dass abgelehnt wird die richtige Hypothese über незначимости kostenloses Mitglied. Für die unbekannten Koeffizienten bei t=5,79405 und p=0,001158. Mit anderen Worten: die Wahrscheinlichkeit, dass abgelehnt wird die richtige Hypothese über незначимости Koeffizienten bei unbekannten, gleich 0,12%.
So kann man argumentieren, dass die resultierende Gleichung der linearen Regression angemessen.
Multiple Regression in Excel erfolgt mit dem gleichen Werkzeug „Datenanalyse». Wir betrachten die konkrete angewandte Aufgabe.
Die Führung der Firma „NNN» muss die Entscheidung über die Angemessenheit des Kaufpreises 20 % des Aktienpakets der AG „MMM». Paketpreis (JV) beträgt 70 Millionen US-Dollar. Spezialisten „NNN” gesammelten Daten über ähnliche Transaktionen. Es wurde beschlossen bewerten den Wert der Anteile nach Parametern, ausgedrückt in Millionen US-Dollar, wie:
Darüber hinaus wird die Option Schulden des Unternehmens nach dem Gehalt (V3 N) in tausend US-Dollar.
Zunächst müssen Sie eine Tabelle mit den Quelldaten. Sie hat die folgende Form:
Weiter:
Markieren den Punkt „Neues Worksheet” und drücken „Ok“.
Erhalten Regressionsanalyse für diese Aufgaben.
„Sammeln» aus den gerundeten Daten oben dargestellten auf dem Blatt tabellarischen Excel-CPU, Regressionsgleichung:
SP = 0,103*SOF + 0,541*VO ü 0,031*VK +0,405*VD +0,691*VZP ü 265,844.
Mehr In der üblichen mathematischen Form ist es geschrieben werden können, wie:
Y = 0,103*x1 + 0,541*x2 ü 0,031*x3 +0,405*x4 +0,691*x5 ü 265,844
Daten für AO „MMM» sind in der Tabelle dargestellt:
SOF, USD | VO, USD | VK, USD | VD, USD | VZP, USD | SP, USD |
102,5 | 535,5 | 45,2 | 41,5 | 21,55 | 64,72 |
Setzt man in die Gleichung der Regression, erhalten die Ziffer in 64,72 Millionen US-Dollar. Dies bedeutet, dass die Aktien der AG „MMM» nicht zu erwerben, da Ihr Wert auf 70 Millionen US-Dollar ziemlich teuer.
Wie Sie sehen können, die Verwendung von tabellarischen CPU „Excel» und der Regressionsgleichung erlaubt eine fundierte Entscheidung bezüglich der Zweckdienlichkeit ganz bestimmte Transaktion.
Jetzt wissen Sie, was ist Regression. Beispiele in Excel, die oben diskutiert sind, helfen Ihnen bei der Lösung von praktischen Aufgaben aus dem Gebiet der ökonometrie.
Article in other languages:
AR: https://tostpost.com/ar/computers/1904-excel.html
En: https://tostpost.com/computers/9019-regression-in-excel-equation-examples-linear-regression.html
Alin Trodden - autor des Artikels, Herausgeber
"Hi, ich bin Alin Trodden. Ich schreibe Texte, lese Bücher und suche nach Eindrücken. Und ich bin nicht schlecht darin, dir davon zu erzählen. Ich freue mich immer, an interessanten Projekten teilzunehmen."
Verwandte News
Was ist 25 Frames pro Sekunde und kann ich mit seiner Hilfe, Gewicht zu verlieren?
es gibt viele Möglichkeiten zurücksetzen verhassten überflüssigen Pfunde. Die beliebtesten sind spezielle Trainings-und Diät-komplexe. Die ersten enthalten eine Reihe von übungen, die es ermöglichen, stärken den Tonus der Muskeln ...
Wie formatiere ich die Festplatte auf dem Computer
Bei der Computerarbeit entstehen oft jede Art von Fehler, die kann man nicht immer beheben Mitteln Systemwiederherstellung, manchmal muss man zu drastischen Maßnahmen greifen, Z. B. die Festplatte formatieren. Auch, wenn die Festp...
Welche Maßnahmen ergreifen, wenn der Laptop nicht einschalten lässt?
ein Tragbarer Computer ü Helfer und Freund für viele moderne Menschen. Manchmal hört er auf zu arbeiten, in diesem Fall sollten Sie sich an Experten im Service. Kann ich eine eigenständige Diagnose zu verstehen, warum das Not...
mehr oder weniger aktive Internet-Nutzer im Allgemeinen und privaten Netzwerken gehört insbesondere das Wort „Ava». Aber hier ist das Problem: was es bedeutet und was es isst, hat niemand erklärt. Eigentlich ganz einfa...
Fehlercode e fail 0x80004005 und die Lösung dieses Problems
In bestimmten Fällen können Sie sehen, Fehlercode e fail 0x80004005. Dieser Fehler tritt beim starten der virtuellen Maschine durch das Programm Oracle VirtualBox.Ursachenin der Regel Fehlercode e fail 0x80004005 kann man sehen, w...
Dota 2 Legion Commander: Hyde, vor allem die Passage und Empfehlungen
„Dota 2“ entwickelt sich ständig weiter, was sich auf die Liebe der Fans des Spiels auf Augenhöhe mit dem Vorhandensein einer großen Auswahl an Helden, Strategien und Artefakte. Mit jedem Patch ändern exponierte einige...
Kommentare (0)
Dieser Artikel wurde noch kein Kommentar abgegeben, sei der erste!