10 Öppna dataset för linjär Regression
varje datavetare kommer sannolikt att behöva utföra linjära regressionsuppgifter och prediktiva modelleringsprocesser någon gång i sina studier eller karriär. För dig som vill lära dig mer om ämnet eller slutföra några exempeluppdrag kommer den här artikeln att introducera öppna linjära regressionsdataset som du kan ladda ner idag. Dessutom innehåller några av datamängderna i den här listan exempel på regressionsuppgifter som du kan slutföra med data.
linjära Regressionsdataset för maskininlärning
cancer linjär Regression
denna dataset innehåller data som tagits från cancer.gov om dödsfall på grund av cancer i USA. Tillsammans med datasetet innehåller författaren en fullständig genomgång om hur de hämtade och förberedde data, deras undersökande analys, modellval, diagnostik och tolkning.
CDC-Data: Näring, fysisk aktivitet, fetma
från det beteendemässiga Riskfaktorövervakningssystemet vid CDC innehåller denna dataset information om fysisk aktivitet, vikt och genomsnittlig vuxen diet.
Fiskmarknads Dataset för Regression
byggd för multipel linjär regression och multivariat analys innehåller Fiskmarknads Dataset information om vanliga fiskarter i marknadsförsäljningen. Datasetet innehåller fiskarter, vikt, längd, höjd och bredd.
kostnader för sjukförsäkring
denna dataset inspirerades av boken Machine Learning with R av Brett Lantz. Uppgifterna innehåller medicinsk information och kostnader som faktureras av sjukförsäkringsbolag. Den innehåller 1338 rader data och följande kolumner: ålder, kön, BMI, barn, rökare, region, försäkringsavgifter.
New York Stock Exchange Dataset
skapad som en resurs för teknisk analys, innehåller denna dataset historiska data från New York stock market. Datasetet finns i fyra CSV-filer: priser, priser-split-justerat, värdepapper och fundamenta. Med hjälp av dessa data kan du experimentera med prediktiv modellering, rullande linjär regression och mer.
OLS Regression Challenge
OLS regression challenge uppgifter du med att förutsäga cancerdödligheten för amerikanska län. Datasetet innehåller data från cancer.gov, clinicaltrials.gov, och den amerikanska gemenskapsundersökningen. Det är i CSV-format och innehåller följande information om cancer i USA: dödsfall, rapporterade fall, USA: s lännamn, inkomst per län, befolkning, demografi och mer.
Fastighetsprisprognos
denna fastighetsdataset byggdes för regressionsanalys, linjär regression, multipel regression och prediktionsmodeller. Det inkluderar inköpsdatum, husålder, plats, Avstånd till närmaste MRT-station och huspris på enhetsarea.
Rödvinskvalitet
från UCI Machine Learning Repository kan denna dataset användas för regressionsmodellering och klassificeringsuppgifter. Datasetet innehåller information om de kemiska egenskaperna hos olika typer av vin och hur de relaterar till övergripande kvalitet.
Vehicle Dataset från CarDekho
en användbar dataset för pris förutsägelse, innehåller detta fordon dataset information om bilar och motorcyklar som anges på CarDekho.com. uppgifterna finns i en CSV-fil som innehåller följande kolumner: modell, år, försäljningspris, showroom-pris, körda kilometer, bränsletyp, säljartyp, överföring och antal tidigare ägare.
WHO-statistik över förväntad livslängd
denna dataset innehåller information sammanställd av Världshälsoorganisationen och FN för att spåra faktorer som påverkar livslängden. Uppgifterna innehåller 2938 rader och 22 kolumner. Kolumnerna inkluderar: Land, år, utvecklingsstatus, vuxendödlighet, förväntad livslängd, spädbarnsdödsfall, alkoholkonsumtion per capita, landets utgifter för hälsa, immuniseringstäckning, BMI, dödsfall under 5 år, dödsfall på grund av HIV/AIDS, BNP, befolkning, kroppstillstånd, inkomstinformation och utbildning.
med hjälp av datamängderna ovan bör du kunna öva på olika prediktiva modellerings-och linjära regressionsuppgifter. Om du letar efter fler öppna dataset för maskininlärning, se till att kolla in vårt datasetbibliotek och våra relaterade resurser nedan.
alternativt, om du letar efter en plattform för att kommentera dina egna data och skapa anpassade dataset, registrera dig för en gratis provperiod på vår dataanteckningsplattform.