Cuando una encuesta dice, ‘50% de las personas les gusta / apoyan x ‘, ¿no dice esto que realmente no hay sesgo en la distribución, es decir, que no hay correlación?

Mi querido amigo, cuando una encuesta dice: “Al 50% de las personas les gusta / apoyan x”, lo que en realidad no mencionan muchas veces es “con un margen de error de x%”. En la mayoría de los casos de encuestas de encuestas, en realidad está escrito, “el 55% (o cualquier% de edad según el resultado de la encuesta) de personas favorecen al candidato A sobre el candidato B con un margen de error del 3%. Eso constituye un” intervalo de confianza estadística “de 55% más O menos 3%, es decir, 52% a 58%. Lo que significa es, en esa encuesta en particular, si las elecciones se celebraron muchas veces exactamente en las mismas condiciones en que se realizó la encuesta, 52% a 58% la gente votará por el candidato A. La correlación no es aplicable aquí.

En una encuesta, una buena agencia que realice la encuesta DEBE escribir el margen de error (MOE)% de edad, la forma en que se recolectaron las muestras y la forma en que se hicieron las preguntas para evitar sesgos en las respuestas. Lamentablemente, esto no sucede. Prácticamente, para que cualquier resultado de la encuesta sea de alguna utilidad, el MOE no debe ser superior al 5%. Considere una situación en la que una agencia declara que el candidato A obtendría un porcentaje de voto de popularidad en el rango de 40 a 60%, es decir, un MOE de 10%. Esto no impresiona a los lectores ya que es una ventana demasiado amplia y la mayoría de la gente puede predecir esto sin una encuesta. Es por eso que las agencias de encuestas intentan predecir resultados tan cercanos al resultado final como sea posible, de lo contrario, quién les creería como la debacle de la encuesta Literary Digest de las famosas elecciones de 1932.

No estoy seguro de poder agregar mucho a la excelente respuesta de Michael Lamar, pero tal vez un ejemplo de sesgo ayude.

Un famoso ejemplo de una muestra sesgada fue la encuesta Literary Digest de 1932 donde predijeron que Alf Landon vencería a Roosevelt en un derrumbe. La muestra era enorme, millones de encuestados, pero estaba muy sesgada. Encuestaron a sus propios lectores, propietarios de automóviles y propietarios de teléfonos. Los tres grupos eran mucho más ricos que el estadounidense promedio. FDR terminó ganando una de las elecciones más desiguales de la historia.

Las palabras sesgo y correlación tienen un significado preciso en las estadísticas que no está relacionado con la idea sobre la que está preguntando. Si una encuesta bien implementada indica que las personas están divididas casi a la mitad en algún tema, solo significa que no hay una preferencia clara por ninguna de las partes. Nada más y nada menos.

Ahora, supongamos que, en realidad, solo el 30% de la población en general está a favor de un lado particular de algún problema. Sin embargo, suponga que la encuesta se implementó de manera deficiente porque sobremuestreó porciones de la población que tenían la opinión minoritaria. Suponga que la encuesta concluyó erróneamente que aproximadamente el 50% cayó en cada lado del problema. Esa encuesta se llamaría sesgada porque, debido a un muestreo deficiente, el valor esperado del resultado de la encuesta no estaría de acuerdo con el valor de la población que estaba tratando de estimar. Ese es el significado de la palabra sesgo en las estadísticas: el valor esperado del estimador no está de acuerdo con el valor que está tratando de estimar.

La correlación significa aproximadamente que dos variables aleatorias tienden a tener alguna “conexión”. (El significado preciso es un poco técnico, pero te di la esencia de ello). Por ejemplo, las personas que son republicanos registrados tienden a ser más pro-vida. Diríamos que existe una correlación positiva entre (el indicador encendido) ser republicano y (el indicador encendido) ser pro-vida. Tenga en cuenta que en ninguna parte de esta discusión de correlación tuvimos que pensar en qué fracción de la población es republicana. Podríamos tener correlación si el 90%, el 50% o solo el 1% tuviera esta afiliación.