10 Åpne Datasett for Lineær Regresjon
Hver dataforsker vil sannsynligvis måtte utføre lineære regresjonsoppgaver og prediktive modelleringsprosesser på et tidspunkt i studiene eller karrieren. For de av dere som ønsker å lære mer om emnet eller fullføre noen prøveoppgaver, vil denne artikkelen introdusere åpne lineære regresjonsdatasett du kan laste ned i dag. I tillegg inneholder noen av datasettene i denne listen eksempelregresjonsoppgaver som du kan fullføre med dataene.
Lineær Regresjon Datasett For Maskinlæring
Kreft Lineær Regresjon
dette datasettet inneholder data hentet fra cancer.gov om dødsfall på grunn av kreft i Usa. Sammen med datasettet inneholder forfatteren en full gjennomgang av hvordan de hentet og forberedte dataene, deres utforskende analyse, modellvalg, diagnostikk og tolkning.
CDC-Data: Ernæring, Fysisk Aktivitet, Fedme
Fra Behavioral Risk Factor Surveillance System PÅ CDC, inneholder dette datasettet informasjon om fysisk aktivitet, vekt og gjennomsnittlig voksen diett.
Fiskemarkedsdatasett For Regresjon
Bygget For multippel lineær regresjon og multivariat analyse, Inneholder Fiskemarkedsdatasettet informasjon om vanlige fiskearter i markedssalg. Datasettet omfatter fiskearter, vekt, lengde, høyde og bredde.
Sykeforsikringskostnader
dette datasettet ble inspirert av Boken Maskinlæring Med R Av Brett Lantz. Dataene inneholder medisinsk informasjon og kostnader fakturert av helseforsikringsselskaper. Den inneholder 1338 rader med data og følgende kolonner: alder, kjønn, BMI, barn, røyker, region, forsikringsgebyr.
New York Stock Exchange Datasett
Dette datasettet Er Opprettet som en ressurs for teknisk analyse, og inneholder historiske data fra new York stock market. Datasettet kommer i fire CSV-filer: priser, priser-split-justert, verdipapirer og grunnleggende. Ved hjelp av disse dataene kan du eksperimentere med prediktiv modellering, rullende lineær regresjon og mer.
OLS Regresjon Utfordring
OLS regresjon utfordring oppgaver du med å forutsi kreft dødelighet FOR amerikanske fylker. Datasettet inneholder data fra cancer.gov, clinicaltrials.gov Og American Community Survey. Det er I CSV-format og inneholder følgende informasjon om kreft i USA: dødsfall, rapporterte tilfeller, amerikansk fylkesnavn, inntekt per fylke, befolkning, demografi og mer.
Real Estate Price Prediction
dette eiendomsdatasettet ble bygget for regresjonsanalyse, lineær regresjon, multiple regresjon og prediksjonsmodeller. Det inkluderer kjøpsdato, hus alder, plassering, avstand til nærmeste MRT-stasjon, og husprisen på enhetsareal.
Rødvin Kvalitet
fra Uci Machine Learning Repository kan dette datasettet brukes til regresjonsmodellering og klassifiseringsoppgaver. Datasettet inneholder informasjon om de kjemiske egenskapene til ulike typer vin og hvordan de forholder seg til total kvalitet.
Kjøretøy Datasett Fra CarDekho
et nyttig datasett for pris prediksjon, dette kjøretøy datasett inneholder informasjon om biler og motorsykler oppført på CarDekho.com. dataene er i EN CSV-fil som inneholder følgende kolonner: modell, år, salgspris, showroom pris, kilometer kjørt, drivstofftype, selgertype, overføring og antall tidligere eiere.
WHO-Statistikk over Forventet Levealder
dette datasettet inneholder informasjon utarbeidet Av Verdens Helseorganisasjon og Fn for å spore faktorer som påvirker forventet levealder. Dataene inneholder 2938 rader og 22 kolonner. Kolonnene inkluderer: land, år, utviklingsstatus, voksen dødelighet, forventet levealder, spedbarnsdød, alkoholforbruk per innbygger, landets utgifter til helse, immuniseringsdekning, BMI, dødsfall under 5 år, dødsfall på GRUNN AV HIV/AIDS, BNP, befolkning, kroppstilstand, inntektsinformasjon og utdanning.
Ved hjelp av datasettene ovenfor, bør du kunne praktisere ulike prediktiv modellering og lineær regresjonsoppgaver. Hvis du leter etter mer åpne datasett for maskinlæring, bør du sjekke ut vårt datasettbibliotek og våre relaterte ressurser nedenfor.
Alternativt, hvis du er ute etter en plattform for å kommentere dine egne data og lage tilpassede datasett, registrer deg for en gratis prøveversjon av vår data annotasjonsplattform.