Fundamentos de la Probabilidad: Espacio Muestral y Eventos

Francisco ZavalaFrancisco Zavala
12 min read

La probabilidad y estadística es una rama de las matemáticas que permite analizar fenómenos inciertos y cuantificar el grado de confianza que podemos tener en distintos resultados posibles. Va más allá del simple cálculo numérico: nos proporciona un marco lógico para razonar en condiciones de incertidumbre. Aunque hoy en día es fundamental en campos como, la inteligencia artificial y la ciencia de datos, sus orígenes se remontan a problemas prácticos relacionados con los juegos de azar.

En el siglo XVI, Girolamo Cardano fue uno de los primeros en abordar estos problemas desde una perspectiva sistemática. Más adelante, en el siglo XVII, el matemático Christiaan Huygens escribió el primer tratado formal sobre el tema; Aquel impulso inicial —entender cómo apostar de forma más justa— dio origen a una teoría que ha crecido en profundidad y alcance. De los dados y las cartas, la probabilidad pasó a convertirse en un marco sólido para describir fenómenos aleatorios en física, ingeniería, biología y economía.

Sin embargo, los principios fundamentales siguen siendo los mismos**.** La intuición frente a lo aleatorio sigue poniéndose a prueba, incluso en situaciones simples. Imagina que entras a un casino y comienzas a apostar en un juego de dados. Tras veinte tiradas consecutivas, el resultado ha sido siempre el número 7. ¿Esa secuencia sería suficiente para que te retires, pensando que algo no anda bien? ¿O seguirías jugando, confiando en que, aunque improbable, es un evento posible?

Podrías basar tu decisión en una corazonada… o en un razonamiento más estructurado: ¿qué tan probable es que algo así ocurra por puro azar?

Conceptos clave.

En el campo de la estadística, el punto de partida es el análisis de fenómenos aleatorios que se manifiestan durante experimentos planificados o investigaciones científicas. Estos fenómenos suelen registrarse como datos, ya sean numéricos —como el número de accidentes en una intersección— o categóricos —como la clasificación de productos defectuosos en una línea de producción . Lo esencial es que cada unidad de información recogida en el proceso se denomina observación.

Una observación puede representar tanto una medición cuantitativa como una categoría cualitativa. Por ejemplo, los números 2, 0, 1 y 2 pueden representar el número de accidentes registrados mes a mes en una misma localización, mientras que las letras D y N podrían indicar si ciertos productos inspeccionados resultaron “defectuosos” o “no defectuosos”. En ambos casos, se trata de observaciones que conforman el insumo primario del análisis estadístico.

Para describir el proceso mediante el cual se generan estas observaciones, se utiliza el término experimento. En estadística, un experimento no se limita a entornos controlados como los de laboratorio. Puede tratarse de un evento tan simple como lanzar una moneda o tan complejo como medir la velocidad de un proyectil o recolectar opiniones sobre una política pública. Lo relevante es que cada repetición del experimento produce un resultado que, aunque no puede conocerse con certeza de antemano, conocemos el conjunto completo de posibilidades.

Dado que los resultados de muchos experimentos dependen del azar, la repetición bajo condiciones similares no garantiza la obtención del mismo resultado. Esta variabilidad es precisamente lo que da sentido al uso de herramientas probabilísticas en estadística. Incluso procesos aparentemente simples, como el lanzamiento de una moneda, revelan una estructura subyacente al observarse repetidamente.

Es importante aclarar que el término experimento se aplica de manera general en estadística, incluso en contextos donde no hay manipulación activa de variables. Los estudios observacionales, en los que solo se registran datos sin intervenir en el sistema, o los estudios retrospectivos, que analizan registros históricos, también generan observaciones sujetas a incertidumbre. Por lo tanto, estos casos también se consideran, en esencia, experimentos desde el punto de vista estadístico.

Espacio muestral.

Definición: Al conjunto de todos los resultados posibles de un experimento estadístico se le denomina espacio muestral, y suele representarse con la letra S.

Cada resultado individual dentro de este conjunto se conoce como punto muestral, aunque también puede llamarse elemento o miembro del espacio muestral. Cuando el espacio muestral contiene un número finito de resultados, es posible enumerarlos explícitamente, separándolos por comas y encerrándolos entre llaves.

Por ejemplo, si el experimento consiste en lanzar una moneda al aire, el espacio muestral correspondiente puede expresarse como: S={H, T} Donde H representa “cara” y T, “cruz”.

Ejemplo: Considere el experimento de lanzar un dado. Si nos interesa el número que aparece en la cara superior, el espacio muestral se define como:

$$S_1 = \{1, 2, 3, 4, 5, 6\}$$

Sin embargo, si solo nos interesa saber si el número obtenido es par o impar, podemos definir un espacio muestral alternativo:

$$S_2 = \{\text{par}, \text{impar}\}$$

Este ejemplo ilustra que un mismo experimento puede describirse mediante distintos espacios muestrales, dependiendo del nivel de detalle que se desea capturar. En este caso, S₁ proporciona más información que S₂, ya que conocer el resultado en S₁ permite deducir el correspondiente en S₂​, pero no ocurre lo mismo en sentido contrario. Por lo tanto, en general, es preferible elegir un espacio muestral que conserve la mayor cantidad de información relevante sobre los posibles resultados del experimento.

Ejemplo: Imagina una bolsa que contiene tres bolas de colores diferentes: una roja, una azul y una verde. El experimento consiste en sacar las tres bolas una por una, sin devolverlas, y registrar la secuencia de colores en el orden en que salen.

El espacio muestral aquí está formado por todas las posibles secuencias ordenadas que se pueden obtener al extraer las bolas.

Por lo tanto, el espacio muestral S queda definido como el conjunto de todas las permutaciones de los colores:

$$S = \{ (\text{roja}, \text{azul}, \text{verde}),\ (\text{roja}, \text{verde}, \text{azul}),\ (\text{azul}, \text{roja}, \text{verde}),\ (\text{azul}, \text{verde}, \text{roja}),\ (\text{verde}, \text{roja}, \text{azul}),\ (\text{verde}, \text{azul}, \text{roja}) \}$$

Cada elemento de S representa una posible secuencia en la que pueden salir las bolas. Por ejemplo, la secuencia (azul,roja,verde) indica que primero salió la bola azul, luego la roja y finalmente la verde.

Cuando el espacio muestral contiene un gran número de elementos, o incluso es infinito, resulta inviable enumerar todos los posibles resultados. En estos casos, es más práctico describir el espacio muestral mediante una regla o enunciado que defina sus elementos.

Ejemplo 1: Consideremos un experimento donde seleccionamos al azar un número entero entre 1 y 1,000,000. En lugar de listar cada número, el espacio muestral se describe como

$$S = \{ x \mid x \text{ es un número entero tal que } 1 \leq x \leq 1{,}000{,}000 \}$$

Lo que se lee: “S es el conjunto de todos los números enteros x tales que x está entre 1 y 1,000,000 inclusive”.

Ejemplo 2: Ahora imaginemos un experimento en el que elegimos un punto aleatorio dentro de una línea de longitud 5 metros. El espacio muestral contiene todos los puntos sobre la línea, y se representa por

$$S = \{ x \mid 0 \leq x \leq 5 \}$$

Donde x indica la posición sobre la línea, medida en metros desde un extremo.

Estos ejemplos muestran cómo se pueden manejar espacios muestrales grandes o continuos usando una descripción matemática que delimita claramente los resultados posibles, sin necesidad de listarlos uno por uno.

Eventos

En cualquier experimento, a menudo nos interesa la ocurrencia de ciertos eventos más que la ocurrencia de un resultado específico dentro del espacio muestral. Un evento puede entenderse como un conjunto de resultados o puntos muestrales que cumplen una condición particular.

Por ejemplo, consideremos el experimento de lanzar un dado, cuyo espacio muestral es

$$S_1 = \{1, 2, 3, 4, 5, 6\}$$

Si nos interesa el evento A “el resultado es divisible entre 3”, este evento corresponde al subconjunto

$$A = \{3, 6 \} \subseteq S_1$$

Es decir, A contiene todos los puntos muestrales para los cuales la condición es verdadera.

Otro ejemplo puede surgir en la inspección de productos. Supongamos que se revisan tres artículos y cada uno puede ser “defectuoso” (D) o “no defectuoso” (N). El espacio muestral estará formado por todas las secuencias posibles de resultados, por ejemplo:

$$S = \{DDD, DDN, DND, DNN, NDD, NDN, NND, NNN\}$$

Donde cada secuencia representa el estado de los tres artículos inspeccionados. Si nos interesa el evento B: “más de un artículo es defectuoso”, entonces

$$B = \{DDD, DDN, DND, NDD\} \subseteq S$$

Es el subconjunto de secuencias en las cuales al menos dos artículos son defectuosos. A cada evento corresponde un subconjunto del espacio muestral que agrupa todos los resultados que hacen cierto el evento.

Definición: Un evento es un subconjunto del espacio muestral.

Complemento de un Evento

En muchos experimentos, es común analizar no solo la ocurrencia de un evento específico, sino también su complemento, es decir, todos los resultados que no pertenecen a ese evento.

Consideremos, por ejemplo, un estudio sobre los hábitos de tabaquismo entre los empleados de una empresa industrial. Un posible espacio muestral para clasificar a cada individuo podría ser:

$$S = \{\text{no fumador}, \text{fumador ocasional}, \text{fumador moderado}, \text{fumador empedernido}\}.$$

Si definimos el evento A como “ser fumador”, entonces

$$A = \{\text{fumador ocasional }, \text{fumador moderado}, \text{fumador empedernido}\} \subseteq S$$

El complemento de este evento, que denotaremos como Aᶜ, es el conjunto de todos los elementos del espacio muestral que no están en A. En este caso, corresponde al grupo de no fumadores:

$$A^c = \{\text{no fumador}\}.$$

Es decir, Aᶜ agrupa todos los resultados donde el evento A no ocurre.

Definición: El complemento de un evento A respecto del espacio muestral S es el subconjunto de todos los elementos de S que no pertenecen a A. Se denota como Aᶜ.

Operaciones con eventos

Una vez definidos los eventos como subconjuntos del espacio muestral, es natural preguntarse qué sucede cuando combinamos eventos. Existen operaciones entre eventos que permiten formar nuevos eventos, también representados como subconjuntos del mismo espacio muestral.

Intersección de eventos

Supongamos ahora que dos eventos, A y B, están asociados a un mismo experimento, es decir, son subconjuntos del mismo espacio muestral. En el lanzamiento de un dado, por ejemplo, podemos definir:

$$S = \{1, 2, 3, 4, 5, 6\}$$

$$A = \{2, 4, 6\} \quad \text{(número par)}, \quad B = \{4, 5, 6\} \quad \text{(número mayor que 3)}.$$

Los resultados que hacen que ambos eventos ocurran simultáneamente corresponden a los elementos comunes entre A y B, es decir: A ∩ B = {4, 6}.

Definición: La intersección de dos eventos A y B, denotada por A ∩ B, es el conjunto de todos los elementos que pertenecen simultáneamente a ambos eventos.

Ejemplo: Sea E el evento “la persona seleccionada al azar en un salón es estudiante de ingeniería”, y F el evento “la persona es mujer”. Entonces, la intersección E ∩ F representa el evento “la persona es una estudiante mujer de ingeniería”, es decir, aquellas personas que cumplen ambas condiciones.


Eventos mutuamente excluyentes

En algunos casos, dos eventos no pueden ocurrir al mismo tiempo. Por ejemplo, si definimos:

$$V = \{\text{a}, \text{e}, \text{i}, \text{o}, \text{u}\} \quad \text{(vocales)}, \quad C = \{\text{l}, \text{r}, \text{s}, \text{t}\} \quad \text{(ciertas consonantes)}$$

entonces

$$V \cap C = \varnothing$$

lo cual indica que no hay ningún elemento en común entre los dos conjuntos. En este caso, decimos que los eventos V y C son mutuamente excluyentes.

Definición: Dos eventos A y B son mutuamente excluyentes (o disjuntos) si:

$$A \cap B = \varnothing$$

Es decir, si no tienen ningún punto muestral en común y, por lo tanto, no pueden ocurrir al mismo tiempo.

Ejemplo: Imaginemos una empresa de televisión por cable que ofrece programación en 8 canales. La distribución es la siguiente:

  • 3 canales afiliados a ABC

  • 2 canales afiliados a NBC

  • 1 canal afiliado a CBS

  • 1 canal educativo

  • 1 canal deportivo (ESPN)

Supongamos que un espectador enciende el televisor sin seleccionar un canal específico, es decir, se elige uno al azar. Definimos los siguientes eventos:

  • A: “el canal pertenece a la cadena NBC

  • B: “el canal pertenece a la cadena CBS

En este caso:

$$A = \{\text{Canal 4, Canal 5}\}, \quad B = \{\text{Canal 6}\}$$

Como ningún canal puede pertenecer a más de una cadena, los eventos A y B son disjuntos. Es decir: A∩B=∅ Por tanto, no hay intersección posible: un canal no puede ser de NBC y de CBS al mismo tiempo. Esto los convierte en eventos mutuamente excluyentes.


Unión de eventos

Hasta ahora, hemos explorado el complemento e intersección de eventos. Sin embargo, en muchos contextos prácticos estamos interesados en determinar si ocurre al menos uno de dos eventos. Este concepto se representa mediante la unión de eventos.

Ahora consideremos un ejemplo numérico más tradicional. Supongamos que lanzamos un dado, con espacio muestral:

S = {1, 2, 3, 4, 5, 6}

Definimos dos eventos:

  • A = {2, 4, 6}: el número es par

  • B = {4, 5, 6}: el número es mayor que 3

Queremos ahora describir el evento “ocurre A o ocurre B” (o ambos). Esto nos lleva a definir la unión:

$$A \cup B = \{2, 4, 5, 6\}$$

Definición: La unión de dos eventos A y B, denotada por A ∪ B, es el conjunto de todos los resultados que pertenecen a A, B o a ambos.

  • A ∩ B: representa los resultados que satisfacen simultáneamente ambos eventos.

  • A ∪ B: representa los resultados que satisfacen al menos uno de los eventos.


Ejemplo con código.

from matplotlib import pyplot as plt
from matplotlib_venn import venn3

# Definir tres conjuntos con más elementos
A = {'libro', 'computadora', 'papel', 'pluma', 'lápiz', 'borrador', 'regla'}
B = {'papel', 'teléfono', 'libro', 'cuaderno', 'marcador', 'regla', 'calculadora'}
C = {'computadora', 'cuaderno', 'papel', 'marcador', 'tijeras', 'lápiz'}

# Crear el conjunto universo (para ilustrar el complemento)
U = A.union(B).union(C)

# Crear el diagrama de Venn para tres conjuntos
venn = venn3([A, B, C], set_labels=('A', 'B', 'C'))

# Personalizar el diagrama de Venn
venn.get_label_by_id('100').set_text('Solo en A')
venn.get_label_by_id('010').set_text('Solo en B')
venn.get_label_by_id('001').set_text('Solo en C')
venn.get_label_by_id('110').set_text('A ∩ B')
venn.get_label_by_id('101').set_text('A ∩ C')
venn.get_label_by_id('011').set_text('B ∩ C')
venn.get_label_by_id('111').set_text('A ∩ B ∩ C')

# Mostrar el gráfico
plt.title("Operaciones entre conjuntos A, B y C")
plt.show()

# Imprimir operaciones adicionales
print("A ∪ B ∪ C =", A.union(B).union(C))
print("A ∩ B ∩ C =", A.intersection(B).intersection(C))
print("A - (B ∪ C) =", A.difference(B.union(C)))
print("B - A =", B.difference(A))
print("Complemento de C respecto al universo:", U.difference(C))
print("Elementos comunes entre A y B pero no en C:", (A & B) - C)


A ∪ B ∪ C = {'marcador', 'calculadora', 'tijeras', 'regla', 'computadora', 'teléfono', 'lápiz', 'libro', 'borrador', 'papel', 'cuaderno', 'pluma'}

A ∩ B ∩ C = {'papel'}

A - (B ∪ C) = {'borrador', 'pluma'}

B - A = {'cuaderno', 'marcador', 'teléfono', 'calculadora'}

Complemento de C respecto al universo: {'calculadora', 'regla', 'teléfono', 'libro', 'borrador', 'pluma'}

Elementos comunes entre A y B pero no en C: {'libro', 'regla'}

La probabilidad, al final, es una herramienta para dar forma numérica a la incertidumbre. Nos permite medir cuán confiable es un evento, y con ello, tomar decisiones más informadas en contextos donde el azar también juega su parte. Con estos conceptos fundamentales claros, ya estamos en condiciones de avanzar hacia ideas más abstractas y útiles dentro del estudio de la probabilidad.

0
Subscribe to my newsletter

Read articles from Francisco Zavala directly inside your inbox. Subscribe to the newsletter, and don't miss out.

Written by

Francisco Zavala
Francisco Zavala