O co chodzi w losowaniu bez zwracania i gdzie to się spotyka?
Intuicyjna różnica: losowanie z odkładaniem i bez odkładania
Wyobraź sobie pudełko z kulami: część jest biała, część czarna. Wkładasz rękę, losujesz kulę i sprawdzasz kolor. Teraz pojawia się kluczowe pytanie: czy odkładasz ją z powrotem do pudełka, czy nie?
Jeżeli odkładasz kulę po każdym losowaniu, liczba kul w pudełku się nie zmienia, a skład (proporcja kolorów) pozostaje taki sam. Każde kolejne losowanie jest wtedy niezależne od poprzedniego. Taki model nazywa się losowaniem ze zwracaniem i często opisuje się go schematem Bernoulliego.
Jeżeli natomiast nie odkładasz kuli, liczba kul się zmniejsza, a w dodatku zmienia się udział poszczególnych kolorów. Zobaczenie białej kuli za pierwszym razem wpływa na szansę zobaczenia białej kuli za drugim razem. Losowania stają się zależne, a taki model to właśnie losowanie bez zwracania. To tu pojawia się rozkład hipergeometryczny i „ubywające mianowniki” w rachunkach.
Przykłady z życia: nie tylko kule i karty
Model losowania bez zwracania pojawia się w wielu naturalnych sytuacjach, nawet jeśli nikt nie mówi tam wprost o prawdopodobieństwie:
- Gra w karty – wyciąganie kolejnych kart z talii bez wkładania ich z powrotem. Klasyczne zadanie: „Jakie jest prawdopodobieństwo, że w pięciu kartach będą dokładnie dwa asy?”.
- Rekrutacja – losowy wybór kilku osób z większej grupy (np. komisja wyłania 3 osoby z 10 kandydatów). Jeśli ktoś już został wybrany, nie może zostać wybrany drugi raz.
- Kontrola jakości – pobieranie próbek z partii produktów. Jeżeli próbki są niszczone podczas badań, to nie wracają do partii. Każdy kolejny pobór zmienia strukturę tego, co zostało.
- Badania opinii w małej grupie – jeśli ankieter wybiera losowo kilka osób bez możliwości powtórnego wyboru tej samej osoby, to mamy typowy przykład losowania bez zwracania.
W praktyce niemal wszystkie fizyczne losowania „z pudełka” bez osobnego mechanizmu resetującego (jak mieszanie kart między każdym losowaniem) są losowaniami bez zwracania, nawet jeśli zadanie szkolne nie wypowiada tego wprost.
Co się zmienia matematycznie i dlaczego to takie ważne
W losowaniu ze zwracaniem prawdopodobieństwo wylosowania danego typu elementu w każdym kroku jest takie samo. Można je wtedy mnożyć bez większej refleksji: p, p, p,…. W losowaniu bez zwracania każdy kolejny krok ma inne prawdopodobieństwo, bo zmieniają się:
- liczba wszystkich możliwych elementów do wylosowania,
- liczba elementów „korzystnych” (np. czerwonych kul),
- relacje między kolejnymi losowaniami – zdarzenia stają się zależne.
Jeśli ktoś w zadaniu z losowaniem bez zwracania policzy prawdopodobieństwo jak dla schematu Bernoulliego (przyjmując stałe p i niezależność), otrzyma błędny wynik. Czasem ten wynik „prawie się zgadza” przy dużej populacji i małej próbie, co bywa szczególnie zdradliwe. Dobrze jest więc od samego początku odróżniać te dwa modele i świadomie wybierać właściwy wzór.
Losowanie ze zwracaniem vs bez zwracania – kluczowe różnice
Zależność zdarzeń: kiedy losowania są niezależne
Zdarzenia losowe są niezależne, jeśli wynik jednego z nich nie zmienia prawdopodobieństwa drugiego. W modelu losowania z odkładaniem tak właśnie się dzieje: po każdym losowaniu sytuacja „zaczyna się od nowa”. Liczba kul i ich proporcje się nie zmieniają, więc:
Prawdopodobieństwo wylosowania czerwonej kuli przy każdym losowaniu wynosi np. ciągle 3/10, jeśli w pudełku leżą 3 czerwone i 7 białych kul.
W losowaniu bez zwracania zdarzenia są zależne. Jeśli za pierwszym razem wylosujesz czerwoną kulę, to w kolejnym losowaniu:
- jest już o jedną czerwoną mniej,
- jest mniej kul w ogóle,
- szansa na wylosowanie czerwonej kuli w drugim kroku zmienia się względem pierwszego.
Formalnie przechodzi się wtedy z iloczynu takich samych czynników (p, p, p…) do iloczynu różnych ułamków o malejących mianownikach. To właśnie widać w zadaniach, gdzie w kolejnym losowaniu zamiast „/10” pojawia się „/9”, potem „/8” itd.
Jak zmieniają się wzory na prawdopodobieństwo w obu modelach
W schemacie Bernoulliego (losowanie ze zwracaniem, niezależne próby) dla liczby sukcesów k w n próbach używa się rozkładu dwumianowego:
P(X = k) = C(n, k) · pk · (1 − p)n−k
gdzie p to stałe prawdopodobieństwo sukcesu w pojedynczym losowaniu. To podejście sprawdza się, gdy:
- każdy eksperyment jest identyczny w rozkładzie (samodzielny rzut monetą, losowanie kul z odkładaniem),
- zdarzenia kolejnych losowań są niezależne.
W losowaniu bez zwracania nie ma stałego p, bo po każdym losowaniu zmienia się liczba sukcesów i porażek. Dla takich zadań naturalnym narzędziem jest rozkład hipergeometryczny, który wykorzystuje kombinacje:
P(X = k) = [C(K, k) · C(N − K, n − k)] / C(N, n)
Tutaj N to liczba wszystkich elementów, K – liczba sukcesów w populacji, n – liczba losowań (pobranych elementów), a k – liczba sukcesów w próbie.
„Ubywające kule” vs stałe parametry – porównanie podejść
W prostych zadaniach „na kule” często stosuje się dwa style:
- Styl Bernoulliego – mnożenie stałych prawdopodobieństw, czasem z użyciem C(n, k), jeśli zdarzenia są niezależne.
- Styl „ubywających kul” – iloczyn różnych ułamków, w których na bieżąco aktualizuje się licznik i mianownik po każdym losowaniu, odpowiadający losowaniu bez zwracania.
Pierwszy styl jest prostszy, ale mniej realistyczny w zadaniach, gdzie elementów jest niewiele, a nie są odkładane. Drugi jest wierny sytuacji fizycznej, choć wymaga większej uważności. Często można przejść z jednego na drugi, np. zauważając, że iloczyny „ubywających ułamków” w zadaniach bez zwracania można skrócić do ładnych kombinacji.
W praktyce szkolnej dobrym nawykiem jest krótkie sprawdzenie: „czy w zadaniu ktoś zwraca elementy po losowaniu?”. Jeśli nie, to bezpieczniej założyć, że trzeba będzie użyć kombinacji i rozkładu hipergeometrycznego, a nie schematu Bernoulliego.
Niezbędne podstawy – prawdopodobieństwo, kombinacje i notacja
Przypomnienie klasycznego modelu prawdopodobieństwa
W zadaniach typu „losujemy elementy z pewnego zbioru” stosuje się zwykle klasyczną definicję prawdopodobieństwa:
P(A) = liczba wyników sprzyjających zdarzeniu A / liczba wszystkich możliwych wyników.
Warunkiem sensownego zastosowania tej definicji jest założenie, że wszystkie pojedyncze wyniki są równie możliwe. W losowaniu kart z dobrze przetasowanej talii czy kul z dobrze wymieszanej urny to założenie jest naturalne. Główna trudność nie leży więc w samej definicji, ale w policzeniu:
- ile jest wszystkich możliwych wyników,
- ile z nich spełnia warunek z treści zadania.
Kombinacje – kiedy kolejność nie ma znaczenia
W losowaniu bez zwracania często interesuje jedynie zbiór wylosowanych elementów, a nie kolejność ich pojawiania się. Jeśli dociągnięcie czerwonej kuli jako pierwszej lub trzeciej nie robi różnicy, zadanie wymaga policzenia kombinacji:
C(n, k) = liczba sposobów wybrania k elementów z n elementów, gdy kolejność nie ma znaczenia.
Kombinacje opisuje się również symbolem „n po k”. W słowach:
„n po k” to liczba różnych podzbiorów k-elementowych, jakie można utworzyć z n-elementowego zbioru.
W zadaniach z losowaniem bez zwracania kombinacje pojawiają się na dwa sposoby:
- liczba wszystkich możliwych prób (np. liczba możliwych 5-elementowych rąk kart),
- liczba prób „korzystnych” (np. liczba 5-elementowych rąk zawierających dokładnie dwa asy).
Kiedy kolejność ma znaczenie, a kiedy nie
Rozróżnienie „kolejność ma znaczenie / nie ma znaczenia” jest kluczowe, bo prowadzi do innych narzędzi:
- Kolejność ma znaczenie – liczy się układ typu „pierwszy, drugi, trzeci…”, np. przydział funkcji (przewodniczący, zastępca, sekretarz). Wtedy spotyka się permutacje oraz iloczyny prostych prawdopodobieństw po kolei.
- Kolejność nie ma znaczenia – ważne jest tylko, kto ostatecznie znalazł się w grupie, a nie w jakiej kolejności został wybrany. To przypadek kombinacji i typowy kontekst rozkładu hipergeometrycznego.
Czytając zadanie, dobrze jest od razu zadać sobie dwa pytania:
- Czy ten sam zestaw osób/elementów, ale losowanych w innej kolejności, traktuję jako jeden czy wiele różnych wyników?
- Czy w treści występują role przypisane do pozycji (np. „pierwszy wylosowany”, „drugi wylosowany”)?
Jeśli różne kolejności liczą się jako osobne wyniki – trzeba uwzględnić permutacje lub drzewko z kolejnością. Gdy kolejność nie jest istotna, wystarczą kombinacje, często wprost we wzorze rozkładu hipergeometrycznego.
Jak z treści zadania wyłuskać odpowiedni model
Sama forma rachunków wynika z tego, jak dokładnie opisany jest eksperyment. Pomaga krótka checklista:
- Czy po każdym losowaniu element wraca do puli? Jeśli tak – rozważ schemat Bernoulliego, jeśli nie – przejdź do rozkładu hipergeometrycznego.
- Czy interesuje kolejność? Jeśli tak – analizuj losowania po kolei (drzewko, permutacje), jeśli nie – rozważ wszystkie możliwe zbiory (kombinacje).
- Czy w zadaniu wyróżniono dwie kategorie (np. „sukces”/„porażka”, „czerwony”/„nieważny”)? To typowy sygnał do postawienia parametrów N, K, n, k.
Taki sposób czytania treści zadania często poprawia skuteczność bardziej niż znajomość kolejnych gotowych wzorów, bo pozwala od razu wybrać właściwą strategię obliczeń.

Drzewko prawdopodobieństwa przy losowaniu bez zwracania
Kiedy rysować drzewko, a kiedy lepiej odpuścić
Drzewko prawdopodobieństwa to wizualne narzędzie, które pozwala po kolei prześledzić możliwe scenariusze losowań. Przydaje się szczególnie wtedy, gdy:
- losujemy małą liczbę elementów (np. 2–3),
- zadanie odnosi się do konkretnych kolejności („najpierw czerwony, potem biały”),
- trzeba zrozumieć zależności między zdarzeniami, zanim przejdzie się do wzorów.
Gdy liczba losowań rośnie (4, 5, 6 i więcej), drzewko zaczyna się gwałtownie rozrastać. Wtedy rysowanie pełnej struktury staje się niepraktyczne i łatwo się na nim zgubić. W takich przypadkach lepszym wyborem jest:
- liczenie z użyciem kombinacji (bez śledzenia każdej ścieżki),
- albo wypisanie jedynie najważniejszych przypadków (np. ścieżek kończących się określoną liczbą sukcesów).
Jak zmieniają się gałęzie drzewa po każdym losowaniu
Przykład: w urnie jest 3 czerwone i 2 białe kule. Losujemy 2 kule bez zwracania. Zdarzenia:
- C – wylosowano kulę czerwoną,
- B – wylosowano kulę białą.
Drzewko ma w pierwszym kroku dwie gałęzie:
- Pierwsze losowanie: P(C) = 3/5, P(B) = 2/5.
Jeżeli w pierwszym losowaniu padło C (czerwona), to w drugim kroku zostają:
- 2 czerwone, 2 białe – razem 4 kule,
- P(C w drugim | C w pierwszym) = 2/4, P(B w drugim | C w pierwszym) = 2/4.
Jeśli w pierwszym losowaniu padło B (biała), to:
Drzewko dla losowania bez zwracania – domknięcie przykładu i przejście do kombinacji
Jeśli w pierwszym losowaniu padło B (biała), to w urnie zostaje:
- 3 czerwone, 1 biała – razem 4 kule,
- P(C w drugim | B w pierwszym) = 3/4, P(B w drugim | B w pierwszym) = 1/4.
Możliwe pary wyników (kolejność ma znaczenie):
- C, C – prawdopodobieństwo: (3/5) · (2/4),
- C, B – prawdopodobieństwo: (3/5) · (2/4),
- B, C – prawdopodobieństwo: (2/5) · (3/4),
- B, B – prawdopodobieństwo: (2/5) · (1/4).
Gdy interesuje wyłącznie liczba czerwonych kul, a nie kolejność, ścieżki trzeba połączyć. Na przykład prawdopodobieństwo wylosowania dokładnie jednej czerwonej to:
P(dokładnie 1 C) = P(C, B) + P(B, C) = (3/5 · 2/4) + (2/5 · 3/4).
Ten sam wynik można policzyć „kombinacyjnie”, bez drzewka. Wtedy liczy się:
- liczbę wszystkich możliwych par kul: C(5, 2),
- liczbę par z dokładnie jedną czerwoną: C(3, 1) · C(2, 1).
P(dokładnie 1 C) = [C(3, 1) · C(2, 1)] / C(5, 2),
czyli dokładnie ten sam wynik, ale bez śledzenia kolejnych losowań.
Różnica między drzewkiem a podejściem kombinacyjnym jest zasadnicza:
- drzewko – śledzi każdy krok, przydatne do zrozumienia, jak „ubywają” kule i jak zmienia się prawdopodobieństwo,
- kombinacje – zliczają końcowe konfiguracje, omijając szczegóły kolejności.
Przy 2–3 losowaniach oba podejścia są porównywalnie wygodne. Gdy liczba losowań rośnie, drzewko przestaje być praktyczne, a kombinacje i rozkład hipergeometryczny zaczynają wygrywać prostotą.
Rozkład hipergeometryczny „w akcji” – typowe typy zadań
Dokładnie k sukcesów – schemat bazowy
Najprostsze zadanie bez zwracania ma strukturę:
- jest N elementów, z czego K to „sukcesy” (np. karty pewnego koloru, wybrane osoby, wadliwe produkty),
- losujemy n elementów bez zwracania,
- interesuje prawdopodobieństwo, że w próbie znajdzie się dokładnie k sukcesów.
W takim schemacie działa bezpośrednio wzór hipergeometryczny:
P(X = k) = [C(K, k) · C(N − K, n − k)] / C(N, n).
Warto przy tym patrzeć na strukturę licznika:
- C(K, k) – wybór „dobrych” elementów (sukcesów),
- C(N − K, n − k) – dobieranie pozostałych z „neutralnych” lub „złych”.
Poniżej dwie sytuacje, które na pierwszy rzut oka wyglądają podobnie, a jednak inaczej się je liczy.
„Dokładnie k sukcesów” kontra „co najmniej jeden sukces”
1. Dokładnie k sukcesów – klasyczna forma, bezpośrednio z hipergeometrii. Przykład: w talii leży pewna liczba kart danego koloru, losuje się kilka kart i pytanie brzmi: jakie jest prawdopodobieństwo wylosowania dokładnie 2 kart tego koloru?
2. Co najmniej jeden sukces – tu bezpośrednie podejście kusi: zsumować P(X = 1) + P(X = 2) + … Ale przy większych n takie sumowanie robi się żmudne. Zwykle prościej policzyć zdarzenie przeciwne: „ani jednego sukcesu”.
Schemat jest wtedy następujący:
- policz P(X = 0) = [C(K, 0) · C(N − K, n)] / C(N, n) = C(N − K, n) / C(N, n),
- weź P(X ≥ 1) = 1 − P(X = 0).
W praktyce losowań bez zwracania rozróżnienie tych dwóch typów pytań jest istotne: formalnie to ten sam model, ale inny wybór wygodniejszego sposobu liczenia.
Co najmniej / co najwyżej – porównanie strategii
Dla zadań „co najmniej k sukcesów” i „co najwyżej k sukcesów” występują dwie strategie:
- sumowanie kilku wartości P(X = i),
- przejście do zdarzenia przeciwnego, jeśli liczba składników do zsumowania robi się mniejsza.
Przykładowo, gdy X – liczba sukcesów w n losowaniach:
- P(X ≥ 1) wygodniej liczyć jako 1 − P(X = 0),
- P(X ≥ 2) to: 1 − [P(X = 0) + P(X = 1)],
- P(X ≤ 2) to: P(X = 0) + P(X = 1) + P(X = 2).
Wybór między sumowaniem „z przodu” a odejmowaniem „od 1” zależy od tego, ile składników trzeba policzyć. Porównanie:
- gdy n jest małe, zsumowanie wszystkich możliwych i tak nie jest problemem,
- gdy n jest większe, zdarzenie przeciwne zwykle wymaga mniej składników, a rachunki stają się krótsze.
Losowania bez zwracania przy podziale na kategorie
Rozkład hipergeometryczny najczęściej opisuje dwie kategorie („sukces” i „nie-sukces”), ale w zadaniach szkolnych często występuje więcej typów elementów, np. różne kolory kul albo kilka klas produktów. Wtedy są dwie możliwości:
- sprowadzić zadanie do dwóch grup („interesujące” / „reszta”),
- zostawić kilka kategorii i pracować na iloczynie kombinacji.
Przykładowo, jeśli w urnie są czerwone, białe i niebieskie kule, a pytanie brzmi o liczbę czerwonych, kategorie „białe” i „niebieskie” można zlać w jedną grupę „nie-czerwone”. Wtedy bezpośrednio pasuje rozkład hipergeometryczny z parametrami K = liczba czerwonych, N − K = liczba wszystkich pozostałych.
Jeśli jednak zadanie pyta: „dokładnie 2 czerwone, 1 białą i 1 niebieską”, struktura staje się trójkolorowa. Prawdopodobieństwo można wtedy zapisać jako:
P = [C(KC, 2) · C(KB, 1) · C(KN, 1)] / C(N, 4),
gdzie KC, KB, KN – liczby kul danego koloru. Rozkład hipergeometryczny pojawia się tu w formie rozszerzonej – zamiast dwóch koszyków (sukces / reszta) są trzy (lub więcej), ale pomysł liczenia jest ten sam: dobieranie kombinacji z osobnych grup.
Przykłady porównawcze – te same dane, różne modele
Losowanie kart: ze zwracaniem vs bez zwracania
Sytuacja: z pełnej talii losuje się dwie karty.
- Ze zwracaniem – po pierwszym losowaniu karta wraca do talii i jest tasowana. Prawdopodobieństwa obu losowań są identyczne, a próby niezależne.
- Bez zwracania – po pierwszym losowaniu karta nie wraca; w drugim kroku w talii jest już o jedną kartę mniej.
Porównanie dla pytania: jakie jest prawdopodobieństwo, że obie karty będą tego samego koloru?
1. Ze zwracaniem – wygodniej użyć schematu Bernoulliego, skupiając się na pojedynczym kolorze (np. „pik”) i ewentualnie mnożąc później przez liczbę kolorów, albo licząc bezpośrednio przez sumowanie wariantów kolorystycznych. Prawdopodobieństwo w drugim losowaniu nie zależy od pierwszego, bo talia wraca do stanu wyjściowego.
2. Bez zwracania – podejdźmy „kombinacyjnie”. Wszystkich możliwych par kart jest C(52, 2). Par, w których obie karty są tego samego koloru, jest:
- dla jednego koloru: C(13, 2),
- łącznie: 4 · C(13, 2).
P = [4 · C(13, 2)] / C(52, 2).
Ten wynik można też uzyskać, myśląc sekwencyjnie (drzewko): pierwsza karta może być dowolna, po jej wylosowaniu w talii zostaje 51 kart, z czego 12 tego samego koloru. Prawdopodobieństwo, że druga będzie tego samego koloru, to 12/51. Dla podejścia sekwencyjnego liczenie jest proste, bo nie trzeba rozróżniać typów kart, tylko patrzy się na „ten sam kolor co poprzednio”.
Porównując oba warianty (z i bez zwracania), widać różnicę: przy losowaniu bez zwracania drugi krok zależy od pierwszego, przy losowaniu ze zwracaniem – nie.
Losowanie osób do zadań: role vs skład grupy
Losowania bez zwracania często łączą się z przydzielaniem ról. Przykład: z pewnej grupy osób wybiera się trzy różne osoby na trzy różne funkcje. Pytanie może brzmieć:
- jaka jest szansa, że wśród wybranej trójki znajdzie się osoba o określonej cesze (np. konkretna specjalizacja),
- albo: jaka jest szansa, że konkretna osoba zostanie przewodniczącym.
Te dwa pytania różnią się charakterem:
- „czy znajdzie się w grupie” – to zadanie o składzie, a nie o kolejności. Model bliższy hipergeometrii i kombinacjom.
- „czy zostanie przewodniczącym” – tu kolejność (konkretna rola) ma znaczenie, więc naturalne jest liczenie „po kolei” lub permutacje.
Jeśli liczy się jedynie skład trzyosobowej grupy (bez ról), zdarzenia są zwykle opisywane przez kombinacje, np. „ile jest grup, w których jest dokładnie jedna osoba o danej cesze”. Gdy ten sam zestaw osób obsadza się w różne funkcje, wyników jest więcej – każdy inny przydział ról traktowany jest jako odrębny wynik. Wtedy w tle pojawiają się permutacje lub iloczyny prawdopodobieństw przy losowaniu kolejnych funkcji.
Produkcja i kontrola jakości – niezależne próby vs pobranie próbki
W zadaniach z produkcją często miesza się dwa modele:
- model Bernoulliego – każdy produkt jest losowo wadliwy z prawdopodobieństwem p, niezależnie od innych,
- model hipergeometryczny – w partii jest z góry ustalona liczba wadliwych sztuk.
W pierwszym podejściu prawdopodobieństwo wylosowania wadliwej sztuki nie zależy od tego, co wylosowano wcześniej. Dobrze opisuje sytuacje, w których jakość każdej sztuki jest wynikiem niezależnego procesu (np. elektroniczne komponenty produkowane na bieżąco).
W drugim podejściu „populacja” jest zamknięta: mamy gotową partię, w której liczba wadliwych jest ustalona i znana. Gdy kontroler losuje próbkę kilku elementów bez zwracania, każdy kolejny wynik zależy od poprzednich. To idealne miejsce dla rozkładu hipergeometrycznego.
Praktyczna wskazówka: jeśli treść sugeruje, że firma zna liczbę wadliwych sztuk w partii (np. „w partii 1000 sztuk jest dokładnie 20 wadliwych”), to model hipergeometryczny lepiej odzwierciedla rzeczywistość niż Bernoulli z szacowanym p = 20/1000, zwłaszcza gdy próbka jest stosunkowo duża względem całej partii.

Od drzewka do wzoru – jak przechodzić między podejściami
Iloczyny „ubywających” ułamków a kombinacje
W zadaniach bez zwracania często pojawia się „ręczne” mnożenie kolejnych prawdopodobieństw, np.:
P = (K/N) · ((K − 1)/(N − 1)) · …,
gdzie K to liczba sukcesów, N – liczba elementów. Taki iloczyn można zwykle przepisać jako stosunek kombinacji. Schemat jest następujący:
- liczniki tworzą iloczyn malejących liczb K, K − 1, …,
- mianowniki – iloczyn malejących liczb N, N − 1, …
Te „schodki” pojawiają się w definicjach silni, a z nich z kolei buduje się kombinacje. Dlatego wiele skomplikowanych iloczynów można uprościć, rozpoznając fragmenty typu:
K · (K − 1) · … · (K − k + 1) = K! / (K − k)!,
a dalej zamieniając na C(K, k) poprzez:
C(K, k) = K! / (k! · (K − k)!).
Dzięki temu:
- długie rozwinięcia „krok po kroku” zamieniają się w zwięzłe stosunki kombinacji,
- łatwiej jest porównać dwa różne rozwiązania tego samego zadania (np. drzewko vs wzór).
Typowe pułapki w zadaniach z losowaniem bez zwracania
Przy rozkładzie hipergeometrycznym mylą się nie tyle wzory, ile interpretacja danych. Dwa zadania o „kulach w urnie” mogą wyglądać podobnie, ale różnić się drobnym słowem, które całkowicie zmienia rachunek. Kilka najczęstszych potknięć:
- mylenie modelu z Bernoullim – użycie dwumianu przy losowaniu bez zwracania, gdy próbka nie jest mała względem populacji,
- nieprawidłowe N – wzięcie „wszystkich elementów z treści”, choć losowanie dotyczy tylko części z nich,
- mieszanie ról z samą obecnością – wprowadzenie permutacji tam, gdzie liczy się wyłącznie skład zbioru,
- podwójne liczenie tych samych wyników – zbyt szerokie sumowanie przypadków „co najmniej / co najwyżej”.
Dwa pierwsze błędy wynikają głównie z pośpiechu przy czytaniu, dwa kolejne – z braku rozróżnienia między „kto jest w grupie” a „kto co robi”.
Jak rozpoznać, że trzeba hipergeometrii, a nie dwumianu?
Zamiast zapamiętywać listę słów-kluczy, lepiej porównać dwa obrazy sytuacji:
- dwumian (Bernoulli) – nieskończony magazyn, każda sztuka losowo dobra lub zła z tym samym p,
- hipergeometria – zamknięte pudło z ustaloną liczbą „dobrych” i „złych” przedmiotów, losowanie zmienia skład pudła.
Kilka praktycznych wskazówek rozróżniających:
- Jeśli w treści pada: „w partii jest dokładnie 20 wadliwych” – to gotowa populacja, mocna przesłanka do hipergeometrii.
- Jeśli mowa o prawdopodobieństwie pojedynczego produktu, a wielkość partii w ogóle się nie pojawia – to raczej model Bernoulliego.
- Jeżeli próbka jest bardzo mała w stosunku do populacji (np. 5 sztuk z magazynu, w którym leżą tysiące), wyniki obu modeli będą liczbowo bliskie; wtedy wybór jest bardziej kwestią wygody niż „poprawności”.
Rozróżnienie staje się istotne tam, gdzie próbka „wyraźnie narusza” populację, np. losowanie 10 elementów z 50 lub 20 uczniów z klasy.
Strategie szacowania i przybliżeń
Modele bez zwracania danych bywają liczone „na oko”, zwłaszcza poza typowymi zadaniami szkolnymi. Dobrze jest umieć zdecydować, kiedy szczegółowy rozkład hipergeometryczny daje zysk, a kiedy wystarczy prostsze przybliżenie.
- Przybliżenie dwumianowe – użyteczne, gdy populacja jest duża, a próbka mała. Zamiast dokładnego:
P(X = k) = [C(K, k) · C(N − K, n − k)] / C(N, n),
można liczyć:
P(X = k) ≈ C(n, k) pk(1 − p)n − k, gdzie p = K/N. - Rozkład Poissona – gdy n jest duże, p bardzo małe, a oczekiwana liczba sukcesów λ = np umiarkowana, zaś losowanie „bardziej przypomina” Bernoulliego niż sztywne „N elementów w urnie”.
Przykład praktyczny: kontroler wybiera z taśmy losowe produkty do sprawdzenia jakości. Jeśli taśma jest bardzo długa, a udział wadliwych szacuje się na promile, dokładna hipergeometria nie wniesie wiele ponad dwumian z p ≈ stałym. Gdy jednak kontrola dotyczy zamkniętej partii kilkudziesięciu sztuk, precyzyjny rozkład bez zwracania może zmienić decyzję o odrzuceniu całej serii.
Jak uprościć skomplikowane warunki w zadaniach
Wielu trudnościom z losowaniem bez zwracania można zapobiec, stosując dwa filtry:
- czy można sprowadzić problem do „sukces / reszta”,
- czy warto przejść do zdarzenia przeciwnego.
Kilka typowych przekształceń:
- „co najmniej jedna czerwona” – łatwiej liczyć jako 1 minus „żadnej czerwonej”. Od razu powstaje klarowny zestaw: sukces = czerwona, reszta = nieczerwona.
- „dokładnie dwie parzyste liczby” w losowaniu liczb bez powtórzeń – liczby parzyste vs nieparzyste, zamiast śledzić każdy konkretny numer.
- „max jeden wadliwy” – to suma przypadków „0 wadliwych” + „1 wadliwy”, którą często da się wyrazić prostymi kombinacjami na dwóch kategoriach.
Im bardziej warunek bazuje na właściwości elementu (kolor, typ, wada, specjalizacja), a mniej na jego „imieniu i nazwisku”, tym szybciej opłaca się łączyć elementy w grupy zamiast patrzeć na nie z osobna.
Porównanie rozwiązań: drzewko, kombinacje, rachunek wskaźników
Te same zadania z losowaniem bez zwracania da się zazwyczaj rozwiązać na trzy sposoby:
- drzewko i iloczyn ułamków – czytelne, ale długie,
- stosunek kombinacji – kompaktowy, wymaga rozpoznania liczby wariantów,
- rachunek wskaźników / zmienne losowe – najbardziej „statystyczny”, sprzyja późniejszym uogólnieniom.
Krótki przykład z życia: z grupy kandydatów wybiera się komisję rekrutacyjną. Można:
- rysować drzewko kolejnych losowań członków komisji i śledzić, kto już jest wylosowany,
- po prostu policzyć, ile kombinacji spełnia warunki (np. „dokładnie jedna osoba z działu A, jedna z B, reszta z C”) i podzielić przez C(N, n),
- opisać liczbę osób z działu A jako zmienną losową X ~ hipergeom., a potem korzystać z jej rozkładu przy różnych pytaniach.
Drzewko jest dobre na start i do weryfikacji intuicji. Kombinacje dają szybkie odpowiedzi, gdy schemat jest już jasny. Zmienne losowe sprawdzają się przy serii podobnych pytań – na przykład gdy interesują kolejne prawdopodobieństwa P(X ≥ 1), P(X ≥ 2), P(X = 3) dla tego samego losowania.
Losowanie bez zwracania a oczekiwana liczba sukcesów
Przy rozkładzie hipergeometrycznym ważne jest nie tylko P(X = k), lecz także średnia liczba sukcesów. Dla:
X – liczba sukcesów w próbie n z populacji N z K sukcesami,
obowiązuje prosta zależność:
E(X) = n · (K/N).
To ten sam wzór, co w modelu dwumianowym z p = K/N. Różnica między bez zwracania a ze zwracaniem nie pojawia się w wartości oczekiwanej, tylko w rozrzucie wokół tej średniej.
W praktyce oznacza to, że jeśli z magazynu, w którym znany jest udział wadliwych, regularnie pobiera się próbkę tej samej wielkości, oczekiwana liczba wadliwych w próbce jest taka sama niezależnie od tego, czy losuje się z ponownym odkładaniem, czy bez. Zmienia się jednak kształt rozkładu: przy losowaniu bez zwracania skrajne wyniki (bardzo mało lub bardzo dużo wadliwych) są na ogół mniej prawdopodobne.
Losowania bez zwracania w kontrolach losowych i audytach
Kontrole losowe, audyty dokumentów czy wybór plików do szczegółowego sprawdzenia bardzo często bazują nieformalnie na losowaniu bez zwracania. Raz wybrany element nie powinien trafiać drugi raz do tego samego audytu – wtedy próba jest „czysta”, a wyniki bardziej reprezentatywne.
Dwie odmienne praktyki:
- pobranie jednej, jednorazowej próbki – klasyczny model hipergeometryczny: populacja o znanym (lub szacowanym) składzie, próba bez zwracania, interesuje liczba błędów, wad lub odchyleń,
- stałe, okresowe pobieranie małych próbek – częściej traktowane jak próby Bernoulliego, bo baza danych jest duża, stale rośnie i „odświeża się” między kontrolami.
W mniejszych organizacjach, gdzie audyt obejmuje większość lub znaczną część wszystkich dokumentów, losowanie bez zwracania jest bliższe rzeczywistości i dobrze oddaje spadek niepewności po każdym sprawdzonym elemencie. W dużych systemach, gdzie zasób jest praktycznie nieograniczony, różnica między dwoma modelami staje się w liczbach znacznie słabsza.
Jak uczyć się rozkładu hipergeometrycznego na przykładach
Przy nauce łatwo ugrzęznąć w symbolach N, K, n, k. Szybsze oswojenie dają ćwiczenia, w których te same dane liczone są na dwa sposoby i porównywane.
Dobrze sprawdza się schemat:
- Ułożyć niewielki, konkretny przykład (np. kilka kart, kilkanaście kul).
- Rozwiązać go „intuicyjnie” – drzewkiem lub ręcznym mnożeniem ułamków.
- Ten sam wynik przepisać jako stosunek kombinacji, identyfikując N, K, n, k.
- Na koniec spróbować wymienić słowny opis („w urnie są… losujemy… interesuje nas…”) na zapis zmiennej losowej X wraz z jej rozkładem.
Porównywanie tych trzech perspektyw (intuicyjnej, kombinacyjnej i „statystycznej”) pomaga nie gubić się w zadaniach, w których inaczej brzmi pytanie, a w tle działa dokładnie ten sam mechanizm losowania bez zwracania.
Najważniejsze punkty
- Losowanie bez zwracania różni się od losowania ze zwracaniem tym, że każde kolejne losowanie zmienia skład zbioru – maleje zarówno liczba wszystkich elementów, jak i liczba elementów „korzystnych”.
- W losowaniu ze zwracaniem kolejne próby są niezależne, a prawdopodobieństwo sukcesu p pozostaje stałe, więc wygodnie opisuje je schemat Bernoulliego i rozkład dwumianowy.
- W losowaniu bez zwracania kolejne wyniki są zależne: wcześniejsze losowania wpływają na następne, co w rachunkach widać jako „malejące mianowniki” (np. /10, potem /9, /8 itd.).
- Zastosowanie modelu ze stałym p (jak przy losowaniu ze zwracaniem) do sytuacji bez zwracania prowadzi do błędnych wyników, nawet jeśli przy dużych populacjach przybliżenie czasem wydaje się „prawie poprawne”.
- Naturalnym narzędziem dla losowania bez zwracania jest rozkład hipergeometryczny, który opisuje liczbę sukcesów w próbie bez zamiany elementów, np. przy losowaniu kart, kontroli jakości czy rekrutacji.
- Dwa popularne style liczenia to: proste mnożenie stałych prawdopodobieństw (jak w schemacie Bernoulliego) oraz „styl ubywających kul”, gdzie po każdym losowaniu aktualizuje się licznik i mianownik; wybór zależy od tego, czy w realnej sytuacji elementy wracają do puli.
- Większość fizycznych losowań z ograniczonej puli – karty, próbki produktów, wybór osób z małej grupy – ma charakter losowania bez zwracania, chyba że jawnie wprowadzi się mechanizm resetu (np. dokładne przetasowanie kart po każdym losowaniu).
Opracowano na podstawie
- Introduction to Probability. Cambridge University Press (2008) – Podstawy rachunku prawdopodobieństwa, rozkład dwumianowy i hipergeometryczny
- A First Course in Probability. Pearson (2019) – Schemat Bernoulliego, niezależność zdarzeń, rozkłady dyskretne
- Statistical Inference. Duxbury Press (2002) – Modele losowania z i bez zwracania, zastosowania w estymacji
- Probability and Random Processes. Oxford University Press (2001) – Formalne definicje niezależności i modeli prób losowych
- All of Statistics: A Concise Course in Statistical Inference. Springer (2004) – Próby losowe, rozkłady dwumianowy i hipergeometryczny w praktyce
- An Introduction to Probability Theory and Its Applications, Vol. 1. Wiley (1974) – Klasyczne ujęcie prawdopodobieństwa, przykłady z kartami i kulami






