10 avointa aineistoa lineaarista regressiota varten
jokainen datatieteilijä joutuu todennäköisesti suorittamaan lineaarisia regressiotehtäviä ja ennakoivia mallinnusprosesseja jossain vaiheessa opintojaan tai uraansa. Niille teistä, jotka haluavat oppia lisää aiheesta tai suorittaa joitakin näyte tehtäviä, tässä artikkelissa esitellään avoin lineaarinen regressioaineistot voit ladata tänään. Lisäksi jotkut tämän luettelon tietokokonaisuudet sisältävät näytteen regressiotehtäviä, jotka voit suorittaa tietojen kanssa.
koneoppimisen Lineaarinen Regressioaineisto
syöpä lineaarinen regressio
tämä aineisto sisältää tietoja, jotka on otettu cancer.gov syöpäkuolemista Yhdysvalloissa. Yhdessä aineisto, tekijä sisältää täyden läpikäynti siitä, miten he hankitaan ja valmistellaan tiedot, niiden eksploratiivinen analyysi, mallin valinta, diagnostiikka, ja tulkinta.
CDC-tiedot: Ravitsemus, liikunta, lihavuus
CDC: n Behavioral Risk Factor Surveillance System-järjestelmästä tämä tietokokonaisuus sisältää tietoja liikunnasta, painosta ja keskimääräisestä aikuisruokavaliosta.
Kalamarkkinatietokanta regressiota varten
Monilineaarista regressiota ja monimuuttuja-analyysia varten laadittu Kalamarkkinatietokanta sisältää tietoja markkinamyynnissä esiintyvistä kalalajeista. Aineisto sisältää kalalajit, painon, pituuden, korkeuden ja leveyden.
Sairasvakuutuskulut
tämä aineisto on saanut innoituksensa Brett Lantzin kirjasta Machine Learning with R. Aineisto sisältää potilastietoja ja sairausvakuutusyhtiöiden laskuttamia kustannuksia. Se sisältää 1338 riviä tietoja ja seuraavat sarakkeet: ikä, sukupuoli, BMI, lapset, tupakoitsija, alue, vakuutusmaksut.
New Yorkin pörssin tietokokonaisuus
luotu teknisen analyysin resurssiksi, tämä tietokokonaisuus sisältää historiallista tietoa New Yorkin pörssistä. Aineisto on neljässä CSV-tiedostossa: hinnat, hinnat-jaoteltuina, arvopaperit ja perustekijät. Näiden tietojen avulla voit kokeilla ennakoivaa mallinnusta, rullaavaa lineaarista regressiota ja paljon muuta.
OLS-Regressiohaaste
OLS-regressiohaaste tehtävät, joilla ennustat syöpäkuolleisuutta Yhdysvaltain maakunnissa. Aineisto sisältää tietoja cancer.gov, clinicaltrials.gov, ja American Community Survey. Se on CSV-muodossa ja sisältää seuraavat tiedot syövästä Yhdysvalloissa: kuolleisuus, raportoidut tapaukset, Yhdysvaltain piirikunnan nimi, tulot piirikuntaa kohti, väestö, väestötiedot ja paljon muuta.
kiinteistöjen Hintaennustus
tämä kiinteistötietokanta on rakennettu regressioanalyysia, lineaarista regressiota, moninkertaista regressiota ja ennustemalleja varten. Se sisältää ostopäivän, talon ikä, sijainti, etäisyys lähimpään MRT-asemalle,ja talon hinta yksikköalue.
punaviinin laatu
UCI Machine Learning Repository-tietokannasta tätä tietokokonaisuutta voidaan käyttää regressiomallinnus-ja luokittelutehtäviin. Aineisto sisältää tietoa eri viinilajien kemiallisista ominaisuuksista ja siitä, miten ne liittyvät yleiseen laatuun.
Ajoneuvotietokanta cardekholta
hyödyllinen tietokokonaisuus hintojen ennustamiseksi, tämä ajoneuvotietokanta sisältää tietoja autoista ja moottoripyöristä, jotka on lueteltu CarDekho.com. tiedot ovat CSV-tiedostossa, joka sisältää seuraavat sarakkeet: malli, vuosi, myyntihinta, näyttelytilan hinta, ajetut kilometrit, polttoainetyyppi, myyjätyyppi, lähetys ja aikaisempien omistajien lukumäärä.
WHO: n elinajanodotetta koskevat tilastot
tämä tietokokonaisuus sisältää Maailman terveysjärjestön ja Yhdistyneiden Kansakuntien kokoamia tietoja elinajanodotteeseen vaikuttavien tekijöiden seuraamiseksi. Aineistossa on 2938 riviä ja 22 saraketta. Sarakkeet sisältävät: maa, vuosi, kehitysasema, aikuisten kuolleisuus, elinajanodote, imeväiskuolleisuus, alkoholinkäyttö henkeä kohti, maan terveysmenot, rokotuskattavuus, BMI, alle 5-vuotiaat kuolleet, HIV/aidsin aiheuttamat kuolemat, BKT, väestö, kehon kunto, tulotiedot ja koulutus.
yllä olevien aineistojen avulla sinun pitäisi pystyä harjoittelemaan erilaisia ennustavan mallinnuksen ja lineaarisen regression tehtäviä. Jos etsit lisää avoimia tietokokonaisuuksia koneoppimiseen, tutustu aineistokirjastoomme ja siihen liittyviin resursseihimme alla.
Vaihtoehtoisesti, jos etsit alustaa, jolla voit merkitä omia tietojasi ja luoda mukautettuja tietokokonaisuuksia, Rekisteröidy ilmaiseen kokeiluun tietojen merkintäalustastamme.