Lasso Regression In Stata Forex

Ich bin mit Verwirrung und Schwierigkeiten mit glmnet mit Lasso, wo mein Ergebnis der Dichotom ist. Ich habe einen kleinen gefälschten Datenrahmen unten: Die Spalten (Variablen) im obigen Dataset sind wie folgt: Das Ziel dieses Beispiels ist es, Lasso verwenden, um ein Modell vorhersagen Kind Asthma-Status aus der Liste der 6 potenziellen Prädiktor-Variablen (Alter, Geschlecht, bmip, medu, pedu und fcolor). Offensichtlich ist die Stichprobengröße hier ein Problem, aber ich hoffe, mehr Einblick in die Handhabung der verschiedenen Arten von Variablen (dh kontinuierliche, ordinal, nominal und binär) innerhalb des Glmnet-Framework zu gewinnen, wenn das Ergebnis binär ist (1 Asthma 0 kein Asthma). Als solches würde jemand bereit sein, ein Beispiel R-Skript zusammen mit Erklärungen für dieses dumme Beispiel mit Lasso mit den oben genannten Daten vorhersagen Asthma-Status Obwohl sehr einfach, ich kenne mich, und wahrscheinlich viele andere auf CV wäre sehr dankbar Die Zeile xfactors lt - model. matrix (asthma gender medu pedu fcolor), - 1 kodiert die kategorische Variable fcolor (wie von as. factor in den vorherigen Zeilen deklariert). Es sollte die Standard-R-Dummy-Variablen-Codierung verwenden, es sei denn, das Argument contrasts. arg wird mitgeliefert. Dies bedeutet, dass alle Ebenen von fcolor gleich gewichtet und nicht gerichtet sind, mit Ausnahme der ersten, die als Referenzklasse verwendet wird und in den Intercept absorbiert wird. Ndash Alex 27. Okt 15 um 5: 16 Ich weiß, das würde die statistische Schlussfolgerung schlammig, aber ich bin wirklich nur damit beschäftigt, so nah an einem genauen Modell, wie ich kann. Ich habe eine dichotome Ergebnis Variable, mit einem großen Satz von dichotomous Prädiktoren. Ich denke, ich möchte mit LASSO versuchen, um auszuwählen, welche Variablen ich in meinem Modell enthalten sollte, dann geben Sie diese ausgewählten Variablen in eine Logit-Regression. Gibt es etwas, das ich übersieht, wenn es um die Praktikabilität dieses Ansatzes gefragt wird, gibt es keine Garantie dafür, dass ein lineares Wahrscheinlichkeitsmodell ein Logitmodell sehr gut annähern wird, folglich die Teilmenge von Variablen, die für eins ausgewählt werden Weniger geeignet für den anderen. Zweitens, die Neuanpassung gilt überhaupt keine Schrumpfung, trotz der variablen Auswahl, die im ersten Schritt stattgefunden riskieren schwere Fehlerkalibrierung amp vielleicht ein wenig Verlust der Diskriminierung. Möglicherweise können Sie die Prozedur auf einem bestimmten Datensatz zu validieren, aber es scheint nicht sicher im Allgemeinen oder zu bieten jeden Vorteil gegenüber einer schrittweisen logistische Regression. Und natürlich kann seine unnötige LASSOs L1-Norm Strafe für die Schrumpfung Amp-Auswahl in der logistischen Regression verwendet werden. Beantwortet Jan 27 15 um 13: 56LARS: Stata-Modul zur Durchführung der kleinsten Winkel Regression Least Angle Regression ist ein Modell-Gebäude-Algorithmus, der Parsimony sowie Vorhersage Genauigkeit berücksichtigt. Diese Methode wird detailliert durch das Papier Efron, Hastie, Johnstone und Tibshirani (2004), veröffentlicht in der Annals of Statistics. Ihre Motivation für diese Methode war ein rechnerisch einfacherer Algorithmus für die Lasso und Forward Stagewise Regression. Es gibt viele Kritik an der schrittweisen Regression, von denen eines ist, dass es ein algorithmischer Algorithmus ist und dass die Regressionskoeffizienten zu groß sind. Die Ridge-Regression ist eine Methode der Modellbildung, die die Koeffizienten schrumpft, indem die Summe der quadrierten Koeffizienten kleiner als eine Konstante wird. Der Lasso ist ähnlich, aber die Konstante ist, dass die Summe der Quotientenkoeffizienten kleiner als eine Konstante ist. Eine Implikation davon wird sein, dass die Lösung Koeffizienten enthält, die genau 0 sind und daher die Eigenschaft von Parsimony haben, d. h. ein einfacheres Modell. Wenn Sie Probleme beim Herunterladen einer Datei haben, überprüfen Sie, ob Sie die richtige Anwendung haben, um sie zuerst anzuzeigen. Bei weiteren Problemen lesen Sie bitte die IDEAS-Hilfeseite. Beachten Sie, dass diese Dateien nicht auf der IDEAS-Website sind. Bitte haben Sie Geduld, da die Dateien groß sein können. Software-Komponente von Boston College Department of Economics in seiner Serie statistische Software-Komponenten mit der Nummer S456860 zur Verfügung gestellt. Wenn Sie eine Korrektur anfordern, erwähnen Sie bitte die folgenden Punkte: RePEc: boc: bocode: s456860. Siehe allgemeine Informationen zur Korrektur von Material in RePEc. Wenn Sie diesen Artikel verfasst haben und noch nicht bei RePEc registriert sind, empfehlen wir Ihnen, dies hier zu tun. Für technische Fragen zu diesem Artikel oder zur Korrektur seiner Autoren, Titel, Zusammenfassung, Bibliographie oder Download-Informationen kontaktieren Sie bitte: (Christopher F Baum) . Dadurch können Sie Ihr Profil mit diesem Element verknüpfen. Es erlaubt Ihnen auch, potenzielle Zitate zu diesem Punkt zu akzeptieren, dass wir uns unsicher sind. Wenn Referenzen vollständig fehlen, können Sie sie über dieses Formular hinzufügen. Wenn die vollständigen Referenzen ein Element auflisten, das in RePEc vorhanden ist, aber das System nicht mit ihm verknüpft ist, können Sie mit diesem Formular helfen. Wenn Sie über fehlende Elemente wissen, können Sie uns helfen, diese Links zu erstellen, indem Sie die entsprechenden Referenzen in der gleichen Weise wie oben hinzufügen. Wenn Sie ein registrierter Autor dieses Artikels sind, können Sie auch die Registerkarte Zitate in Ihrem Profil überprüfen, da es einige Zitate gibt, die auf die Bestätigung warten. Bitte beachten Sie, dass Korrekturen einige Wochen dauern können, um die verschiedenen RePEc-Dienste zu filtern. Mehr Leistungen MyIDEAS Folgen Sie den Schriftenreihen, Zeitschriften, Autoren amp mehr Neue Papiere per E-Mail Neuzugänge zu RePEc abonnieren Autoreintrag Öffentliche Profile für Wirtschaftswissenschaftler Rankings Verschiedene Forschungsschwerpunkte in Wirtschaftswissenschaften amp Verwandte Themen Genealogie Wer war ein Student von wem, mit RePEc RePEc Biblio Kuratierte Artikel amp papers diverse Wirtschaftswissenschaften MPRA Hochladen Sie Ihr Papier auf RePEc und IDEAS aufgeführt werden EconAcademics Blog Aggregator für Ökonomie Forschung Plagiat Plagiate in Wirtschaftswissenschaften Job-Marktpapiere RePEc Arbeitspapier-Serie auf dem Arbeitsmarkt Fantasy League vorgeben, dass Sie an der Spitze sind Einer Wirtschaftsabteilung Dienstleistungen aus den StL Fed Data, Research, Apps verstärkt mehr aus der St. Louis Fed


Comments