Charakterystyka zmiennej kategorycznej i przykłady

Charakterystyka zmiennej kategorycznej i przykłady

Zmienna kategoryczna Jest to stosowany w statystykach do przypisania charakterystyki lub jakościowej niewidzialnej lub jakościowej do obiektu, indywidualnego, podmiotu, warunku lub procedur. Możliwe jest zdefiniowanie wszystkich rodzajów zmiennych kategorycznych zgodnie z każdą potrzebą. 

Przykładami zmiennych kategorycznych są: kolor, płeć, grupa krwi, stan cywilny, rodzaj materiału, formularz płatności lub rodzaj konta bankowego i są używane codziennie codziennie.

Rysunek 1: Kolor jest zmienną kategoryczną. Źródło: Pixabay

Powyższe są zmiennymi, ale ich możliwe wartości są jakościowe, to znaczy o jakości lub charakterystyce, a nie o pomiarze numerycznym. Na przykład możliwe wartości dla zmiennej seks Czy: Mężczyzna , HEmbra.

Gdy ta zmienna jest przechowywana w programie komputerowym, można ją zadeklarować jako zmienną tekstową, a jedyne zaakceptowane wartości zostaną wyznaczone: Mężczyzna , Kobieta.

Jednak ta sama zmienna seks można zadeklarować i przechowywać jako liczbę całkowitą, jeśli Mężczyzna jest przypisany 1 już Kobieta Wartość jest przypisana 2. Z tego powodu zmienne kategoryczne są czasami nazywane typem wymienionym.

Główną cechą zmiennych kategorycznych jest to, że w przeciwieństwie do innych zmiennych, takich jak ciągłe i dyskretne, nie jest możliwe, aby arytmetyka z nimi. Można jednak z nimi wykonać statystyki, jak to będzie widać później.

[TOC]

Przykłady

Zwróć uwagę na następujące przykłady zmiennych kategorycznych i ich możliwe wartości:

-Grupa krwi, Zakres wartości: A, b, ab, lub

-Status cywilny, Wartości kategoryczne: Pojedynczy (DO), Żonaty (B), Wdowiec (C) , Rozwiedziony (D).

-Rodzaj materiału, Kategorie lub wartości: 1 = drewno, 2 = metal, 3 = plastik

-Sposób na zapłatę, Wartości lub kategorie: (1) gotówka, (2) debet, (3) przelew, (4) kredyt

Może ci służyć: Tesla Cewka: Historia, jak to działa, po co to jest

W poprzednich przykładach liczba została powiązana z każdą kategorią w sposób całkowicie arbitralny. 

Można zatem uznać, że to arbitralne skojarzenie numeryczne sprawia, że ​​jest to równoważne dyskretna zmienna ilościowa, Ale nie jest tak, ponieważ operacje arytmetyczne nie mogą być wykonane z tymi liczbami.

Aby zilustrować pomysł, w zmiennej Sposób na zapłatę, Operacja sumy nie ma sensu:

 (1) skuteczne + (2) debet nigdy nie będzie równoważne (3) Transfer

Klasyfikacja zmiennych kategorycznych

Klasyfikacja opiera się na tym, czy mają niejawną hierarchię, czy też liczba możliwych wyników wynosi więcej niż dwa czy dwa.

Zmienna kategoryczna z jednym możliwym wynikiem nie jest zmienną, jest stałą kategoryczną.

Nominalne kategoryczne 

Kiedy nie mogą być reprezentowane przez liczbę lub mieć zamówienie. Na przykład zmienna: Type_de_material, twartości nominalne (Drewno, metal, plastik), nie mają hierarchii ani zamówienia, nawet gdy dowolna liczba jest przypisywana do każdej odpowiedzi lub kategorii.

Porządek kategoryczny

Zmienny: Wyniki w nauce

Wartości nominalne: Wysoka Średnia Niska

Chociaż wartości tej zmiennej nie są numeryczne, mają one zakaz lub hierarchię.

Binarny kategoryczny

Są to zmienne nominalne z dwiema możliwymi odpowiedziami, na przykład:

-Zmienny: Odpowiedź

-Wartości nominalne: PRAWDA, Podróbka

Zauważ, że zmienna Odpowiedź Nie oznacza hierarchii i ma tylko dwa możliwe wyniki, więc jest to binarna zmienna kategoryczna.

Niektórzy autorzy nazywają ten typ Zmienna binarna, I nie uważają, że należy to do Zmienne kategoryczne które są ograniczone do osób z więcej niż trzema możliwymi kategoriami.

Statystyki ze zmiennymi kategoriami

Statystyki można wykonać za pomocą zmiennych kategorycznych, mimo że nie są zmiennymi numerycznymi lub ilościowymi. Na przykład, aby poznać najbardziej prawdopodobny trend lub wartość zmiennej kategorycznej Moda.

Może ci służyć: astroclymy: historia, jakie studia, gałęzie

Moda W tym przypadku jest to najbardziej powtarzany wynik lub wartość zmiennej kategorycznej. W zmiennych kategorycznych nie można obliczyć ani średniej, ani mediany.

Średniej nie można obliczyć, ponieważ nie można jej zrobić arytmetyki ze zmiennymi kategorycznymi. Ani mediana, ponieważ zmienne ilościowe lub kategoryczne nie mają zamówienia ani hierarchii, więc nie można określić wartości centralnej.

Graficzna reprezentacja zmiennych kategorycznych

Biorąc pod uwagę pewną zmienną kategoryczną, można znaleźć częstotliwość lub liczbę czasów, z którymi powtarzany jest wynik tej zmiennej. Jeśli jest to zrobione dla każdego wyniku, można wykonać wykres częstotliwości w zależności od każdej kategorii lub wyniku.

Oto kilka przykładów, w jaki sposób zmienne kategoryczne mogą być reprezentowane graficznie.

Rozwiązane ćwiczenia

Ćwiczenie 1

Firma ma dane od 170 pracowników. Jedną z zmiennych, które są w tych zapisach, jest: Status cywilny. Ta zmienna ma cztery możliwe kategorie lub wartości:

Pojedynczy (DO), Żonaty (B), Wdowiec (C) , Rozwiedziony (D).

Chociaż jest to zmienna nie-nummer, można wiedzieć, ile z całkowitej rekordy znajduje się w określonej kategorii i być reprezentowanych w postaci wykresu słupkowego, jak pokazano na poniższym rysunku:

Rysunek 2. Reprezentacja wyników zmiennej kategorycznej. Źródło: Self Made

Przykład 2

Sklep obuwia nosi rekord sprzedaży. Wśród zmiennych obsługujących ich rekordy jest kolor butów dla każdego modelu. Zmienna: 

Color_zapato_modelo_aw3

Jest kategoryczny i ma pięć możliwych kategorii lub wartości. Dla każdej kategorii tej zmiennej liczba sprzedaży jest sumowana, a odsetek tego samego jest ustalany. Wyniki przedstawiono na wykresie poniższego rysunku:

Może ci służyć: właściwości elektryczne materiałów Rysunek 3. Kategoryczny kolor zmiennej _ zapato. W ten zmienny sposób jest biały. Źródło: Self Made.

Można wtedy powiedzieć, że z modelu butów AW3, który jest z moda, Najczęściej sprzedawane jest Biały, po nim ściśle Czarny

Można również powiedzieć, że 70% prawdopodobieństwa, że ​​sprzedany jest następny buty, który jest sprzedany w tym modelu Biały albo Czarny.

Informacje te mogą być przydatne w sklepie przy dokonywaniu nowych zamówień, a nawet mogą zastosować rabaty na najmniej sprzedawane kolory do nadmiaru zapasów.

Przykład 3

Dla pewnej populacji dawców krwi chcemy reprezentować liczbę osób należących do pewnej grupy krwi. Graficznym sposobem wizualizacji wyników jest piktogram, który jest w tle tabela.

W pierwszej kolumnie zmienna jest reprezentowana Grupa krwi i jego możliwe wyniki lub kategorie. Druga kolumna ma reprezentację w kultowy lub obrazowy sposób liczby osób w każdej kategorii. W naszym przykładzie jako ikona jest używana czerwona kropla, z których każda reprezentuje 10 osób.

Rysunek 4. Piktogram. Źródło: Self Made

Bibliografia

  1. Khan academy. Analiza danych kategorycznych. Odzyskane z: Khanacademy.org
  2. Formuły wszechświata. Zmienna jakościowa. Źródło: Univesformulas.com
  3. Minitab. Które są zmienne kategoryczne, dyskretne i ciągłe. Odzyskane z: Wsparcie.Minitab.com
  4. Samouczek Excel. Charakterystyka zmiennych. Odzyskane z: pomoc.Xlslat.com.
  5. Wikipedia. Zmienna statystyczna. Wyzdrowiał z Wikipedii.com
  6. Wikipedia. Zmienna kategoryczna. Wyzdrowiał z Wikipedii.com
  7. Wikipedia. Zmienne kategoryczne. Wyzdrowiał z Wikipedii.com