Articles

10 otwartych zestawów danych do regresji liniowej

zestawy danych do regresji liniowej do uczenia maszynowego

każdy analityk danych będzie prawdopodobnie musiał wykonać zadania regresji liniowej i procesy modelowania predykcyjnego w pewnym momencie swoich studiów lub kariery zawodowej. Dla tych z Was, którzy chcą dowiedzieć się więcej na ten temat lub ukończyć przykładowe zadania, w tym artykule przedstawimy otwarte zbiory danych regresji liniowej, które można pobrać już dziś. Dodatkowo, niektóre z zestawów danych na tej liście zawierają przykładowe zadania regresji, które można wykonać z danymi.

zestawy danych regresji liniowej do uczenia maszynowego

regresja liniowa raka

Ten zbiór danych zawiera dane pobrane z cancer.gov o zgonach z powodu raka w Stanach Zjednoczonych. Wraz z zestawem danych autor zawiera pełny opis sposobu pozyskiwania i przygotowania danych, ich eksploracyjnej analizy, wyboru modelu, diagnostyki i interpretacji.

: Odżywianie, aktywność fizyczna, otyłość

z behawioralnego Systemu Nadzoru czynników ryzyka w CDC, ten zbiór danych zawiera informacje o aktywności fizycznej, wadze i średniej diecie dorosłych.

Zestaw danych z rynku rybnego do regresji

zbudowany do wielokrotnej regresji liniowej i analizy wielowymiarowej, zestaw danych z rynku rybnego zawiera informacje o popularnych gatunkach ryb w sprzedaży rynkowej. Zbiór danych obejmuje gatunki ryb, wagę, długość, wysokość i szerokość.

koszty ubezpieczenia medycznego

zestawy danych medycznych

Ten zestaw danych został zainspirowany książką Machine Learning with R autorstwa Bretta Lantza. Dane zawierają informacje medyczne i koszty rozliczane przez zakłady ubezpieczeń zdrowotnych. Zawiera 1338 wierszy danych i następujące kolumny: wiek, płeć, BMI, dzieci, palacz, region, opłaty ubezpieczeniowe.

New York Stock Exchange Dataset

stworzony jako zasób do analizy technicznej, ten zbiór danych zawiera historyczne dane z nowojorskiej giełdy. Zestaw danych jest dostępny w czterech plikach CSV: ceny, ceny-podział-skorygowane, papiery wartościowe i podstawy. Korzystając z tych danych, możesz eksperymentować z modelowaniem predykcyjnym, regresją liniową i innymi funkcjami.

wyzwanie regresji OLS

wyzwanie regresji OLS zadaje ci zadanie przewidywania śmiertelności na raka w hrabstwach USA. Zbiór danych zawiera dane z cancer.gov, clinicaltrials.gov, oraz American Community Survey. Jest w formacie CSV i zawiera następujące informacje na temat raka w USA: śmiertelność, zgłoszone przypadki, nazwa hrabstwa w USA, dochód na Hrabstwo, populacja, dane demograficzne i inne.

Przewidywanie cen nieruchomości

Ten zestaw danych o nieruchomościach został zbudowany do analizy regresji, regresji liniowej, regresji wielokrotnej i modeli przewidywania. Zawiera datę zakupu, wiek domu, lokalizację, odległość do najbliższej stacji MRT i cenę domu jednostki powierzchni.

jakość czerwonego wina

zestawy danych do regresji liniowej

z repozytorium UCI Machine Learning, ten zestaw danych może być używany do modelowania regresji i zadań klasyfikacji. Zbiór danych zawiera informacje o właściwościach chemicznych różnych rodzajów wina i ich związku z ogólną jakością.

Zestaw danych pojazdu z CarDekho

przydatny zestaw danych do przewidywania cen, ten zestaw danych pojazdu zawiera informacje o samochodach i motocyklach wymienionych na CarDekho.com. dane są w pliku CSV, który zawiera następujące kolumny: model, rok, Cena sprzedaży, cena salonu, przejechane kilometry, rodzaj paliwa, Typ sprzedawcy, skrzynia biegów i liczba poprzednich właścicieli.

statystyki WHO dotyczące średniej długości życia

Ten zbiór danych zawiera informacje opracowane przez Światową Organizację Zdrowia i Organizację Narodów Zjednoczonych w celu śledzenia czynników wpływających na średnią długość życia. Dane zawierają 2938 wierszy i 22 kolumny. Kolumny obejmują: kraj, Rok, Stan rozwojowy, śmiertelność dorosłych, średnią długość życia, zgony niemowląt, spożycie alkoholu na mieszkańca, wydatki kraju na zdrowie, zakres szczepień, BMI, zgony w wieku poniżej 5 lat, zgony z powodu HIV/AIDS, PKB, populacja, stan ciała, informacje o dochodach i edukacja.

korzystając z powyższych zestawów danych, powinieneś być w stanie ćwiczyć różne zadania modelowania predykcyjnego i regresji liniowej. Jeśli szukasz więcej otwartych zbiorów danych do uczenia maszynowego, zapoznaj się z naszą biblioteką zbiorów danych i naszymi powiązanymi zasobami poniżej.

alternatywnie, Jeśli szukasz platformy do adnotacji własnych danych i tworzenia niestandardowych zestawów danych, Zarejestruj się na bezpłatną wersję próbną naszej platformy adnotacji danych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *