Articles

10 Otevřených souborů dat pro Lineární Regresní

Lineární Regrese soubory dat pro Strojové Učení

Každý datový vědec, bude pravděpodobně muset provést lineární regrese úkoly a prediktivní modelování procesů v určitém okamžiku v jejich studiu, nebo kariéru. Pro ty z vás, kteří se chtějí dozvědět více o tématu nebo dokončit některé ukázkové úkoly, tento článek představí otevřené lineární regresní datové sady, které si můžete stáhnout dnes. Některé datové sady v tomto seznamu navíc obsahují ukázkové regresní úkoly, které můžete s daty dokončit.

Lineární Regrese soubory dat pro Strojové Učení

Rakovina Lineární Regrese

Tento datový soubor obsahuje data převzata z cancer.gov o úmrtí na rakovinu ve Spojených Státech. Spolu s dataset, autor zahrnuje kompletní návod na to, jak jsou získávány a připravených dat, jejich průzkumné analýzy, výběr modelu, diagnostika a interpretace.

CDC Data: Výživa, fyzická aktivita, obezita

ze systému sledování rizikových faktorů chování na CDC obsahuje tato datová sada informace o fyzické aktivitě,hmotnosti a průměrné stravě dospělých.

Dataset rybího trhu pro regresi

dataset rybího trhu, postavený pro vícenásobnou lineární regresi a vícerozměrnou analýzu, obsahuje informace o běžných druzích ryb v tržním prodeji. Datová sada obsahuje druhy ryb, hmotnost, délka, výška, a šířka.

náklady na zdravotní pojištění

lékařské datové sady

tato datová sada byla inspirována knihou strojové učení S R od Bretta Lantze. Údaje obsahují lékařské informace a náklady účtované zdravotními pojišťovnami. Obsahuje 1338 řádků údajů a následující sloupce: věk, pohlaví, BMI, děti, kuřák, region, poplatky za pojištění.

New York Stock Exchange Dataset

vytvořeno jako zdroj pro technickou analýzu, tato dataset obsahuje Historická data z newyorského akciového trhu. Dataset je dodáván ve čtyřech souborech CSV: ceny, ceny-rozdělené, cenné papíry a fundamenty. Pomocí těchto dat můžete experimentovat s prediktivním modelováním, valivou lineární regresí a dalšími.

OLS regresní výzva

OLS regresní výzva Vás úkoluje předpovídáním míry úmrtnosti na rakovinu pro americké kraje. Dataset obsahuje data z cancer.gov, clinicaltrials.gov, a průzkum americké komunity. Je ve formátu CSV a obsahuje následující informace o rakovině v USA: úmrtnost, hlášené případy, název okresu USA, Příjem na Kraj, populace, demografie, a více.

predikce cen nemovitostí

tato datová sada nemovitostí byla vytvořena pro regresní analýzu, lineární regresi, vícenásobnou regresi a predikční modely. Zahrnuje datum nákupu, věk domu, umístění, vzdálenost k nejbližší stanici MRT, a cena domu za jednotku plochy.

kvalita červeného vína

datové sady vína pro lineární regresi

z úložiště UCI Machine Learning lze tento datový soubor použít pro regresní modelování a klasifikační úkoly. Datová sada obsahuje informace o chemických vlastnostech různých druhů vína a jejich vztahu k celkové kvalitě.

Vozidlo objekt Dataset z CarDekho

užitečné dataset pro predikce cen, toto vozidlo dataset obsahuje informace o auta a motocykly jsou uvedeny na CarDekho.com. Data v CSV souboru, který zahrnuje následující sloupce: model, rok, prodejní cena, showroom ceny, ujetých kilometrů, druh paliva, typ prodejce, převodovka a počet předchozích majitelů.

statistiky WHO o délce života

tento datový soubor obsahuje informace sestavené Světovou zdravotnickou organizací a Organizací spojených národů ke sledování faktorů, které ovlivňují délku života. Data obsahují 2938 řádků a 22 sloupců. Sloupce patří: země, rok, vyvíjí stav, úmrtnost dospělých jedinců, průměrná délka života, dětská úmrtnost, spotřeba alkoholu na jednoho obyvatele, země, výdaje na zdraví, imunizace, BMI, úmrtí pod 5 let, úmrtí v důsledku HIV/AIDS, HDP, počet obyvatel, stav organismu, příjem informací a vzdělávání.

pomocí výše uvedených datových sad byste měli být schopni procvičit různé prediktivní modelování a lineární regresní úlohy. Pokud hledáte více otevřených datových souborů pro strojové učení, nezapomeňte se podívat na naši knihovnu datových souborů a naše související zdroje níže.

alternativně, pokud hledáte platformu pro anotaci vlastních dat a vytváření vlastních datových souborů, zaregistrujte se na bezplatnou zkušební verzi naší platformy pro anotaci dat.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *