10 Nyitva Adatok Lineáris Regressziós
Minden adat tudós valószínűleg, hogy végre lineáris regresszió feladatok, prediktív modellezés folyamatok valamikor a tanulmányok vagy a karrier. Azok számára, akik többet szeretnének megtudni a témáról, vagy kitöltenek néhány mintakiosztást, ez a cikk bemutatja a ma letölthető nyílt lineáris regressziós adatkészleteket. Ezenkívül a listán szereplő adatkészletek némelyike magában foglalja a minta regressziós feladatokat, amelyeket az adatokkal kiegészíthet.
lineáris regressziós adatkészletek a gépi tanuláshoz
rák lineáris regresszió
Ez az adatkészlet tartalmazza az alábbiakból vett adatokat cancer.gov a rák okozta halálesetekről az Egyesült Államokban. Együtt a adatkészlet, a szerző tartalmaz egy teljes körű áttekintése, hogyan szerezték be, s kész az adatokat, a feltáró elemzés, modell kiválasztása, diagnosztika, illetve értelmezése.
CDC adatok: Táplálkozás, fizikai aktivitás, elhízás
A CDC viselkedési kockázati tényező felügyeleti rendszeréből ez az adatkészlet információkat tartalmaz a fizikai aktivitásról, a súlyról és az átlagos felnőtt étrendről.
halpiac Adatkészlet a Regressziós
Épült a többszörös lineáris regresszió, illetve többváltozós elemzés, a halpiac Adatkészlet információkat tartalmaz közös halfajok a piaci értékesítés. Az adatkészlet tartalmazza a halfajokat, a súlyt, a hosszúságot, a magasságot és a szélességet.
egészségbiztosítási költségek
ezt az adatkészletet a Brett Lantz R-vel végzett könyvgéptanulás ihlette. Az adatok egészségügyi információkat és az egészségbiztosítók által kiszámlázott költségeket tartalmaznak. 1338 adatsorból és a következő oszlopokból áll: életkor, nem, BMI, gyermekek, dohányosok, régió, biztosítási díjak.
New York Stock Exchange Dataset
a technikai elemzés forrásaként létrehozott adatkészlet a New York-i tőzsde történelmi adatait tartalmazza. Az adatkészlet négy CSV fájlban található: árak, árak-Split-korrigált, értékpapírok, és fundamentumok. Ezen adatok felhasználásával kísérletezhet prediktív modellezéssel, gördülő lineáris regresszióval stb.
OLS regressziós kihívás
az OLS regressziós kihívás az amerikai megyék rákos halálozási arányának előrejelzésével foglalkozik. Az adatkészlet adatokat tartalmaz cancer.gov, clinicaltrials.gov, és az amerikai közösségi felmérés. Ez a CSV formátumban tartalmazza a következő információkat a rák az USA-ban: halálozási arány, jelentett esetek, US county neve, jövedelem per county, népesség, demográfiai, stb.
ingatlanár-előrejelzés
Ez az ingatlanadatkészlet regressziós elemzésre, lineáris regresszióra, többszörös regresszióra és előrejelzési modellekre épült. Ez magában foglalja a vásárlás dátumát, a ház korát, helyét, a legközelebbi MRT állomástól való távolságot, valamint az egységnyi terület házárát.
vörösbor minőség
az UCI gépi tanulási adattárából ez az adatkészlet regressziós modellezési és osztályozási feladatokhoz használható. Az adatkészlet információkat tartalmaz a különböző borfajták kémiai tulajdonságairól, valamint arról, hogy ezek hogyan viszonyulnak az Általános minőséghez.
Jármű Adatkészlet a CarDekho
hasznos adatkészlet ár jóslat, ez a jármű adatkészlet tartalmaz információkat, autók, motorkerékpárok szerepel CarDekho.com. Az adatok CSV-fájlt, amely tartalmazza a következő oszlopok: modell, építés, eladás, ár, bemutatóterem áron, kilométer alapú, üzemanyag típusa, eladó típus, átviteli, valamint száma előző tulajdonosok.
WHO várható élettartamra vonatkozó statisztikák
Ez az adatkészlet az Egészségügyi Világszervezet és az Egyesült Nemzetek Szervezete által összeállított információkat tartalmazza a várható élettartamot befolyásoló tényezők nyomon követésére. Az adatok 2938 sort és 22 oszlopot tartalmaznak. Az oszlopok a következők: Ország, év, fejlődő állapot, felnőttkori halálozás, várható élettartam, csecsemőhalálozás, az egy főre jutó alkoholfogyasztás, az ország egészségügyi kiadásai, immunizációs lefedettség, BMI, 5 év alatti halálesetek, HIV/AIDS okozta halálesetek, GDP, népesség, testállapot, jövedeleminformáció és Oktatás.
a fenti adathalmazok segítségével különböző prediktív modellezési és lineáris regressziós feladatokat lehet gyakorolni. Ha több nyitott adatkészletet keres a gépi tanuláshoz, feltétlenül nézze meg az alábbi adatkészleteink könyvtárát és kapcsolódó erőforrásainkat.
Alternatív megoldásként, ha olyan platformot keres, amely megjegyzéseket fűzhet a saját adataihoz, valamint egyéni adatkészleteket hozhat létre, iratkozzon fel az adatmegjegyzési platform ingyenes próbaverziójára.