Regression in Excel: die Gleichung, Beispiele. Lineare Regression

Datum:

2018-07-14 01:10:31

Ansichten:

456

Bewertung:

1Wie 0Abneigung

Teilen:

Table of contents:

Regressionsanalyse ä diese statistische Methode der Forschung, zulassend, zeigen die Abhängigkeit eines Parameters von einer oder mehreren unabhängigen Variablen. In докомпьютерную Zeitalter seine Anwendung war ziemlich schwierig sein, besonders wenn die Rede von großen Datenmengen. Heute lernen wie eine Regression in Excel können Sie komplexe statistische Aufgabe in nur wenigen Minuten. Nachfolgend finden Sie konkrete Beispiele aus dem Bereich der Wirtschaft.

Arten von Regression

Dieses Konzept wurde eingeführt in der Mathematik Francis Galton 1886. Regression бывает:

  • линейной;
  • параболической;
  • степенной;
  • экспоненциальной;
  • гиперболической;
  • показательной;
  • логарифмической.

Beispiel 1

Betrachten Sie die Aufgabe der Bestimmung der Abhängigkeit der Anzahl der Ruhestand der Mitglieder des Kollektivs des Durchschnittslohns auf 6 Industrieunternehmen.

Aufgabe. In den sechs analysierten Unternehmen среднемесячную die Löhne und die Zahl der Mitarbeiter, die auf eigenen Wunsch verlassen haben. In der tabellarischen Form haben:

A

B

C

1

X

Die Anzahl der Ruhestand

Gehalt

2

Y

30000 Euro

3

1

60

35000 Euro

4

2

35

40000 Rubel

5

3

20

45000 Rubel

6

4

20

50000 Euro

7

5

15

55000 Rubel

8

6

15

60000 Euro

Für die Aufgabe der Bestimmung der Abhängigkeit der Anzahl der Ruhestand des Durchschnittslohns der Arbeitnehmer an 6 Unternehmen Regressionsmodell hat die Form der Gleichung Y = a0 + a1X1 +…+aKXK, xI ä die Einfluss-Variablen, aI — Regressionskoeffizienten, a k ä Anzahl der Faktoren.

Für diese Aufgabe Y — dies ist ein Indikator Ruhestand Mitarbeiter und Einfluss Faktor " das Gehalt, das bezeichnen X.

Verwendung der Funktionen des tabellarischen CPU „Excel»

Analyse der Regression in Excel sollte vor der Anwendung auf den vorliegenden tabellarischen Daten der integrierten Funktionen. Aber für diese Zwecke besser nutzen sehr nützliche add-in „Paket-Analyse». Um es zu aktivieren, müssen Sie:

Mehr:

Lenovo v580c: eine detaillierte übersicht über

Lenovo v580c: eine detaillierte übersicht über

Heute haben wir beschlossen, zu schreiben über den Laptop Lenovo v580c. Übersicht ausführliche, da dieser tragbare PC IdeaPad-Serie hat eine hohe Popularität, aber viele Menschen wissen nicht, was zieht das Gerät der Käufer. Das Modell ist schnell un...

Wie löschen Sie den Cache Ihres Computers (Browser)

Wie löschen Sie den Cache Ihres Computers (Browser)

Sehr oft im Internet finden Sie die Frage: „Wie Cache leeren Computer?». Diese Formulierung gibt ein user-Neuling, der irgendwo gehört, dass die Art und Weise kann die Arbeit des Computers zu verbessern, aber nicht ganz versteht, worüber ...

Was ist ein BDRip

Was ist ein BDRip

Muss mit bedauern zugeben, dass der Fortschritt in der informatik-und Multimedia-Technologien neben den offensichtlichen Vorteilen hat eine Reihe von negativen Eigenschaften. Zum Beispiel, als vor einigen Jahren die Anbieter zu einem vernünftigen Pre...

  • Mit der Registerkarte „Datei” gehen Sie zum Abschnitt „Einstellungen”;
  • Im geöffneten Fenster wählen Sie die Zeile „Add-ins»;
  • Klicken Sie auf die Schaltfläche „Gehen“ befindet sich am unteren Rand, rechts neben dem Text „Verwaltung»;
  • Setzen Sie ein Häkchen neben dem Namen „Analyse“ ein und bestätigen Sie Ihre Aktionen, indem Sie auf „OK“.

Wenn alles richtig gemacht wurde, im rechten Teil der Registerkarte „Daten», das sich über einem Blatt „Excel», erscheint die gewünschte Schaltfläche.

Lineare Regression in Excel

Nun, wenn die Hand hat alle notwendigen virtuellen Instrumente für die Umsetzung ökonometrische Berechnungen, können Sie beginnen, zur Lösung unseres Problems. Um dies zu tun:

  • Klicken Sie auf die Schaltfläche „Datenanalyse»;
  • Im geöffneten Fenster klicken Sie auf die Schaltfläche „Regression»;
  • In den angezeigten Registerkarte geben Sie einen Wertebereich für Y (Anzahl der Ruhestand der Arbeitnehmer) und für X (deren Gehälter);
  • Bestätigen Sie Ihre Aktion durch drücken der Schaltfläche „Ok“.

In der Folge füllt das Programm automatisch ein neues Blatt tabellarischen CPU-Daten Regressionsanalyse. Bitte beachten Sie! In Excel gibt es die Möglichkeit, den Ort, die Sie bevorzugen für diesen Zweck. Dies kann beispielsweise dasselbe Blatt, wo sind die Werte von Y und X, oder sogar ein neues Buch, speziell entwickelt, um gleichartige Daten zu speichern.

Analyse der Ergebnisse der Regression für R-Quadrat

In Excel die Daten, die im Zuge der Bearbeitung der betrachteten Beispiel haben die Form:

Regression in Excel

Vor allem bitte beachten Sie die Bedeutung der R-Quadrat. Er stellt den determinationskoeffizienten. In diesem Beispiel R-Quadrat = 0,755 (75,5%), d.h. die berechneten Parameter des Modells erklären die Abhängigkeit zwischen den betrachteten Parametern auf 75,5 %. Je höher der Wert des Koeffizienten der determination, damit das ausgewählte Modell gilt als anwendbar für eine bestimmte Aufgabe. Es wird angenommen, dass es korrekt beschreibt die Reale Situation bei einem Wert von R-Quadrat höher als 0,8. Wenn R-Quadrat<0,5, dann ist dies eine Regressionsanalyse in Excel nicht als glaubhaft.

Analyse der Koeffizienten

Die Anzahl der 64,1428 zeigt, welchen Wert Y, wenn alle Variablen xi in der betrachteten Modelle auf null zurückgesetzt. Mit anderen Worten kann man behaupten, dass der Wert der analysierten Parameter einen Einfluss und andere Faktoren, nicht die in ein bestimmtes Modell.

Das Folgende Verhältnis -0,16285, gelegen in der Zelle B18, zeigt die Gewichtung der Einfluss der Variablen X auf Y. Dies bedeutet, dass der Durchschnittliche Gehalt der Mitarbeiter innerhalb des betrachteten Modells wirkt sich auf die Anzahl der Ruhestand mit dem Gewicht -0,16285, d.h. der Grad derder Einfluss ist ziemlich klein. Zeichen «-» weist darauf hin, dass der Koeffizient einen negativen Wert hat. Dies ist offensichtlich, da jeder weiß, dass je mehr Gehalt im Unternehmen, desto weniger Menschen äußern den Wunsch, den Arbeitsvertrag oder das Unternehmen verlässt.

Multiple Regression

Unter diesem Begriff versteht man eine Gleichung Zusammenhang mit mehreren unabhängigen Variablen-Arten:

Y=f(x1+x2+ xM) + ε, wobei y — es ist effektiver Merkmal (abhängige Variable) und x1, x2, …xM — diese Merkmale-Faktoren (unabhängige Variablen).

Schätzung der Parameter

Für die multiple Regression (MR) durchgeführt, unter Verwendung der Methode der kleinsten Quadrate (OLS). Für lineare Gleichungen der Art Y = a + b1X1 +…+bMXM+ ε bauen das System der normalen-Gleichungen (siehe unten)

multiple Regression

Das Prinzip der Methode Zu verstehen, betrachten wir den Faktor der Fall. Dann haben wir die Situation, beschriebene Formel

Koeffizient der Regression

Daraus folgt:

die Gleichung der Regression in Excel

Wo σ ä ist die Varianz des Merkmals, reflektierten im index.

OLS gilt für die Gleichung in MR стандартизируемом Maßstab. In diesem Fall erhalten wir die Gleichung:

lineare Regression in Excel

In dem tY, tX1, …TXm ä стандартизируемые Variablen, deren Mittelwerte gleich 0; βI — standardisierte Regressionskoeffizienten und Standardabweichung ä 1.

Bitte beachten Sie, dass alle βI In diesem Fall definiert als normierte und централизируемые, so dass deren Vergleich untereinander gilt als korrekt und gültig. Darüber hinaus akzeptiert die Durchführung der screenings Faktoren, verwerfen diejenigen, bei denen die kleinsten Werte βi.

Aufgabe unter Verwendung der Gleichung der linearen Regression

Angenommen, eine Tabelle der Dynamik der Preise einer bestimmten Ware N in den letzten 8 Monaten. Muss eine Entscheidung über die Zweckmäßigkeit des Erwerbs seiner Partei zum Preis von 1850 Rbl./T.

A

B

C

1

Nummer des Monats

Monatsname

Der Preis der Ware N

2

1

Januar

1750 Euro pro Tonne

3

2

Januar

1755 Rubel pro Tonne

4

3

März

1767 Rubel pro Tonne

5

4

April

1760 Euro pro Tonne

6

5

Mai

1770 Euro pro Tonne

7

6

Juni

1790 Euro pro Tonne

8

7

Juli

1810 Euro pro Tonne

9

8

August

1840 Rubel pro Tonne

Für die Lösung dieser Aufgabe im Tabellenkalkulationsprogramm „Excel» erforderlich erschließen, bereits bekannt aus der oben aufgeführten Beispiel das Tool „Datenanalyse». Als Nächstes wählen Abschnitt „Regression» und stellen Sie die Parameter. Wir müssen Bedenken, dass im Feld „Eingabe-Intervall Y» eingegeben werden muss Wertebereich für die abhängige Variable (in diesem Fall die Preise für die Ware in bestimmte Monaten des Jahres), und in „Eingabe-Intervall X» ä, für eine unabhängige (Zahl des Monats). Bestätigen die Aktion durch drücken der „Ok“. Neues Blatt (wenn so angegeben) erhalten wir die Daten für die Regression.

Bauen auf Ihnen eine lineare Gleichung der Art y=ax+b, wobei als Parameter a und b treten die Koeffizienten der Zeile mit der Bezeichnung Nummer des Monats und die Koeffizienten und die Zeilen „Y-Kreuzung» aus dem Blatt mit den Ergebnissen der Regressionsanalyse. So, die lineare Regressionsgleichung (UR) für die Aufgabe 3 wird in der Form von:

Der Preis für die Ware N = 11,714* Zahl des Monats + 1727,54.

Oder in algebraischer Notation

Y = 11,714 x + 1727,54

Analyse der Ergebnisse

Um zu entscheiden, ob entsprechend die resultierende Gleichung der linearen Regression werden die Koeffizienten der multiplen Korrelation (KMK) und determination sowie die Fisher-Kriterium und das Kriterium der Student. In Tabelle „Excel» mit den Ergebnissen der Regression treten Sie unter dem Namen multiples R, R-Quadrat, F-Statistik und t-Statistik entsprechend.

KMK R ermöglicht die Beurteilung der überbelegung wahrscheinlichen Zusammenhang zwischen der unabhängigen und abhängigen Variablen. Ihr hoher Wert zeugt von einem ausreichend starken Zusammenhang zwischen den Variablen „Nummer des Monats“ und „der Preis der Ware N in Rubel pro 1 Tonne». Aber die Natur dieser Beziehung ist unbekannt.

Das Quadrat des Pearsonschen Korrelationskoeffizienten R2(RI) ist eine numerische Eigenschaft Anteil der gesamten Streuung und zeigt, welcher Teil der Streuung der experimentellen Daten, d.h. die Werte der abhängigendie Variable entspricht der Gleichung der linearen Regression. In der betrachteten Aufgabe dieser Wert beträgt 84,8%, d.h. die statistischen Daten mit einem hohen Maß an Präzision beschreibt die erhaltenen UR.

Die F-Statistik, der sogenannte Fisher-Kriterium wird zur Bewertung der Signifikanz einer linearen Abhängigkeit, widerlegen oder Bekräftigung der Hypothese von seiner Existenz.

Der Wert der t-Statistik (Student-Kriterium) hilft beurteilen die Bedeutung des Faktors bei unbekannten oder Mitglied der freien Linear abhängig. Wenn der Wert des t-Tests > tCR, dann ist die Hypothese des незначимости Mitglied einer freien linearen Gleichungen abgelehnt.

In dieser Aufgabe für Free member durch Instrumente „Excel» empfangen wurde, dass t=169,20903 und p=2,89 E-12, d.h. wir haben null-die Wahrscheinlichkeit, dass abgelehnt wird die richtige Hypothese über незначимости kostenloses Mitglied. Für die unbekannten Koeffizienten bei t=5,79405 und p=0,001158. Mit anderen Worten: die Wahrscheinlichkeit, dass abgelehnt wird die richtige Hypothese über незначимости Koeffizienten bei unbekannten, gleich 0,12%.

So kann man argumentieren, dass die resultierende Gleichung der linearen Regression angemessen.

Aufgabe über die Zweckmäßigkeit der Kauf des Aktienpakets

Multiple Regression in Excel erfolgt mit dem gleichen Werkzeug „Datenanalyse». Wir betrachten die konkrete angewandte Aufgabe.

Die Führung der Firma „NNN» muss die Entscheidung über die Angemessenheit des Kaufpreises 20 % des Aktienpakets der AG „MMM». Paketpreis (JV) beträgt 70 Millionen US-Dollar. Spezialisten „NNN” gesammelten Daten über ähnliche Transaktionen. Es wurde beschlossen bewerten den Wert der Anteile nach Parametern, ausgedrückt in Millionen US-Dollar, wie:

  • Verbindlichkeiten aus Lieferungen und Leistungen (VK);
  • Volumen des Jahresumsatzes (VO);
  • Forderungen (VD);
  • Anlagevermögens (SOF).

Darüber hinaus wird die Option Schulden des Unternehmens nach dem Gehalt (V3 N) in tausend US-Dollar.

Lösung Mittel tabellarischen Excel-CPU

Zunächst müssen Sie eine Tabelle mit den Quelldaten. Sie hat die folgende Form:

wie eine Regression in Excel

Weiter:

  • Rufen Sie das Fenster „Datenanalyse»;
  • Wählen Sie den Abschnitt „Regression»;
  • Fenster „Eingabe-Intervall Y» geben Wertebereich der abhängigen Variablen aus Spalte G;
  • Klicken Sie auf das Symbol mit dem roten Pfeil rechts neben dem Feld „Eingabe-Intervall X» markieren und auf dem Blatt den Bereich aller Werte aus den Spalten B,C, D, F.

Markieren den Punkt „Neues Worksheet” und drücken „Ok“.

Erhalten Regressionsanalyse für diese Aufgaben.

Regression Beispiele in Excel

Ergebnisse der Studie und Schlussfolgerungen

„Sammeln» aus den gerundeten Daten oben dargestellten auf dem Blatt tabellarischen Excel-CPU, Regressionsgleichung:

SP = 0,103*SOF + 0,541*VO ü 0,031*VK +0,405*VD +0,691*VZP ü 265,844.

Mehr In der üblichen mathematischen Form ist es geschrieben werden können, wie:

Y = 0,103*x1 + 0,541*x2 ü 0,031*x3 +0,405*x4 +0,691*x5 ü 265,844

Daten für AO „MMM» sind in der Tabelle dargestellt:

SOF, USD

VO, USD

VK, USD

VD, USD

VZP, USD

SP, USD

102,5

535,5

45,2

41,5

21,55

64,72

Setzt man in die Gleichung der Regression, erhalten die Ziffer in 64,72 Millionen US-Dollar. Dies bedeutet, dass die Aktien der AG „MMM» nicht zu erwerben, da Ihr Wert auf 70 Millionen US-Dollar ziemlich teuer.

Wie Sie sehen können, die Verwendung von tabellarischen CPU „Excel» und der Regressionsgleichung erlaubt eine fundierte Entscheidung bezüglich der Zweckdienlichkeit ganz bestimmte Transaktion.

Jetzt wissen Sie, was ist Regression. Beispiele in Excel, die oben diskutiert sind, helfen Ihnen bei der Lösung von praktischen Aufgaben aus dem Gebiet der ökonometrie.


Article in other languages:

AR: https://tostpost.com/ar/computers/1904-excel.html

BE: https://tostpost.com/be/kamputary/3334-regres-ya-excel-ra-nanne-pryklady-l-neynaya-regres-ya.html

En: https://tostpost.com/computers/9019-regression-in-excel-equation-examples-linear-regression.html

ES: https://tostpost.com/es/los-ordenadores/3339-la-regresi-n-en-excel-en-la-ecuaci-n-ejemplos-la-regresi-n-lineal.html

HI: https://tostpost.com/hi/computers/1904-regression-in-excel-equation-examples-linear-regression.html

JA: https://tostpost.com/ja/computers/1903-excel.html

KK: https://tostpost.com/kk/komp-yuterler/3336-regressiya-excel-de-te-deu-mysaldar-syzy-ty-regressiya.html

PL: https://tostpost.com/pl/komputery/3338-regresja-w-programie-excel-r-wnanie-przyk-ady-regresja-liniowa.html

PT: https://tostpost.com/pt/computadores/3335-a-regress-o-no-excel-a-equa-o-de-exemplos-regress-o-linear.html

TR: https://tostpost.com/tr/bilgisayarlar/3342-regresyon-excel-denklem-rnekleri-do-rusal-regresyon.html

UK: https://tostpost.com/uk/komp-yuteri/3338-regres-ya-v-excel-r-vnyannya-prikladi-l-n-yna-regres-ya.html

ZH: https://tostpost.com/zh/computers/2015-excel.html






Alin Trodden - autor des Artikels, Herausgeber
"Hi, ich bin Alin Trodden. Ich schreibe Texte, lese Bücher und suche nach Eindrücken. Und ich bin nicht schlecht darin, dir davon zu erzählen. Ich freue mich immer, an interessanten Projekten teilzunehmen."

Kommentare (0)

Dieser Artikel wurde noch kein Kommentar abgegeben, sei der erste!

Kommentar hinzufügen

Verwandte News

Was ist 25 Frames pro Sekunde und kann ich mit seiner Hilfe, Gewicht zu verlieren?

Was ist 25 Frames pro Sekunde und kann ich mit seiner Hilfe, Gewicht zu verlieren?

es gibt viele Möglichkeiten zurücksetzen verhassten überflüssigen Pfunde. Die beliebtesten sind spezielle Trainings-und Diät-komplexe. Die ersten enthalten eine Reihe von übungen, die es ermöglichen, stärken den Tonus der Muskeln ...

Wie formatiere ich die Festplatte auf dem Computer

Wie formatiere ich die Festplatte auf dem Computer

Bei der Computerarbeit entstehen oft jede Art von Fehler, die kann man nicht immer beheben Mitteln Systemwiederherstellung, manchmal muss man zu drastischen Maßnahmen greifen, Z. B. die Festplatte formatieren. Auch, wenn die Festp...

Welche Maßnahmen ergreifen, wenn der Laptop nicht einschalten lässt?

Welche Maßnahmen ergreifen, wenn der Laptop nicht einschalten lässt?

ein Tragbarer Computer ü Helfer und Freund für viele moderne Menschen. Manchmal hört er auf zu arbeiten, in diesem Fall sollten Sie sich an Experten im Service. Kann ich eine eigenständige Diagnose zu verstehen, warum das Not...

Was ist Ava im Internet?

Was ist Ava im Internet?

mehr oder weniger aktive Internet-Nutzer im Allgemeinen und privaten Netzwerken gehört insbesondere das Wort „Ava». Aber hier ist das Problem: was es bedeutet und was es isst, hat niemand erklärt. Eigentlich ganz einfa...

Fehlercode e fail 0x80004005 und die Lösung dieses Problems

Fehlercode e fail 0x80004005 und die Lösung dieses Problems

In bestimmten Fällen können Sie sehen, Fehlercode e fail 0x80004005. Dieser Fehler tritt beim starten der virtuellen Maschine durch das Programm Oracle VirtualBox.Ursachenin der Regel Fehlercode e fail 0x80004005 kann man sehen, w...

Dota 2 Legion Commander: Hyde, vor allem die Passage und Empfehlungen

Dota 2 Legion Commander: Hyde, vor allem die Passage und Empfehlungen

„Dota 2“ entwickelt sich ständig weiter, was sich auf die Liebe der Fans des Spiels auf Augenhöhe mit dem Vorhandensein einer großen Auswahl an Helden, Strategien und Artefakte. Mit jedem Patch ändern exponierte einige...