Zadanie 1: Statystyka opisowa

Ćwiczenie 3.1: UC Irvine Machine Learning Repository
  1. Wejdź na stronę repozytorium uczenia maszynowego Uniwersytetu Kalifornijskiego w Irvine (UCI). Znajdź zestaw danych Automobile, pobierz dane na dysk i wczytaj do R. Zadbaj o to aby dane brakujące otrzymały wartość NA. Znajdź sposób aby dać kolumnom nazwy z opisania danych.
  2. Sprawdź zgodność danych z opisem na stronie repozytorium:

    • jeżeli nie zgadza się typ, dokonaj konwersji, w tym dla danych typu factor.

      zwróć uwagę na to że pierwsza kolumna zawiera uporządkowane dane nominalne o poziomach -3, -2, -1, 0, 1, 2, 3.

    • dane brakujące uzupełnij:

      • dla danych nominalnych użyj mody
      • dla kolumn numerycznych zastosuj cyklicznie następujące zasady:

        1. dla brakujących danych użyj wartości średniej
        2. dla brakujących danych użyj mediany
        3. usuń z danych wszystkie wiersze zawierające brakujące dane


Ćwiczenie 3.2: Samochody

W tym ćwiczeniu wykorzystaj dane Automobile.

  1. Znajdź dla wszystkich numerycznych cech samochodów średnią i odchylenie standardowe. (Podpowiedź: może się przydać funkcja z rodziny apply().)
  2. Znajdź dla wszystkich numerycznych cech samochodów medianę, kwartyle, oraz odchylenie ćwiartkowe. (Podpowiedź: może się przydać funkcja z rodziny apply().)
  3. Dla wszystkich nominalnych cech samochodów wyznacz modę. (Podpowiedź: może się przydać funkcja z rodziny apply().)
  4. Oblicz, ile jest samochodów poszczególnych marek.
  5. Stwórz wykres liczebności samochodów różnych marek.
  6. Który z producentów ma najwięcej samochodów z silnikiem diesla?
  7. Który z producentów ma największy odsetek samochodów z silnikiem diesla?
  8. Który z producentów ma najdroższe, a który najtańsze samochody? (Podpowiedź: może się przydać funkcja tapply() lub aggregate())
  9. Zilustruj graficznie ceny samochodów różnych marek.
  10. Samochody jakiej marki są mniej ryzykowne wzgędem ubezpieczenia?
  11. Oblicz średnią prędkość obrotu w zależności od układu rozrządu silnika.
  12. Zilustruj graficznie średnią prędkość obrotu w zależności od układu rozrządu silnika.
  13. Oblicz średnią prędkość obrotu w zależności od układu rozrządu silnika i typu paliwa.
  14. Zilustruj graficznie średnią prędkość obrotu w zależności od układu rozrządu silnika i typu paliwa.
  15. Stwórz wykres pudełkowy zużycia paliwa na trasie (w litrach na 100 kilometrów) przez samochody z silnikiem diesla i benzynowym.
  16. Stwórz wykres pudełkowy średniego zużycia paliwa (w litrach na 100 kilometrów) przez samochody z silnikiem diesla i benzynowym.
  17. Stwórz histogram dla wag samochodu.
  18. Dodaj do poprzedniego histogramu wykres gęstości.
  19. Stwórz wyrkes beeswarm dla długości, szerokości i wysokości samochodów.
  20. Dodaj do poprzedniego wykresu wykres pudełkowy, aby zobaczyć kwartyle.