¿Cuál es el mejor modelo estadístico para ajustar o simular datos políticos de una gran población, como los datos de votación?

Implementé y ajusté modelos de datos de votación para mi trabajo de posgrado. Como menciona Venugopalreddy, la regresión lineal puede ser suficiente, pero si tiene datos que podrían representarse como una matriz (es decir, muchos votantes, con múltiples votos por votante), es mejor que utilice la teoría de respuesta al ítem / modelos de votación espacial (que es básicamente la factorización matricial con una respuesta logística / probit). Eche un vistazo a estas diapositivas de Kevin Quinn para obtener una descripción general: diapositivas y este documento sobre datos de lista. Pool y Rosenthol son algunos de los primeros desarrolladores de estos modelos.

No estaba del todo claro para mí cómo estás usando la comparación con el promedio; Recomendaría no transformar demasiado los datos y simplemente modelar lo que tiene con un modelo que puede manejar ese tipo de respuesta.

Con respecto a la implementación de su modelo, sugeriría algo como Metropolis Hastings o Gibbs Sampler, para que pueda implementar sus suposiciones sobre cada parte del modelo (comportamiento del votante, utilidad, etc.) con bastante facilidad como funciones separadas en su modelo. Seguí la ruta de implementar un algoritmo de optimización, que en retrospectiva obstaculizó mi capacidad de iterar rápidamente.

Si sus datos no se pueden enmarcar como una matriz de respuestas binarias y, en cambio, puede ser mejor una regresión más tradicional.

[Editar, después de una iteración de comentario: ver más abajo]

Veo. Si tiene el lujo de experimentar, podría imaginar un proceso generativo como este:

1.Los distritos se extraen de uno de los grupos K con probabilidad multinomial.

2. Los individuos en el distrito k provienen del grupo de k (tal vez es un gaussiano).

3. Cada individuo emite un voto basado en su ubicación y la ubicación del candidato.

Por lo tanto, un modelo espacial funciona ya que comparte información entre las personas de un distrito.

Si entiendo a qué se refiere, se pregunta “¿cómo afectarían los distintos conjuntos de reglas de votación a la utilidad social?”

No declaras qué significa “utilidad social”. ¿Estamos hablando de alguna satisfacción general por parte de los votantes? ¿Estamos hablando de satisfacción con los resultados electorales o satisfacción con la forma en que gobiernan los políticos?

Si es satisfacción con los resultados electorales, entonces tendría que preguntar cuál es el significado de saber la respuesta a esta pregunta de investigación. Me parece que la única satisfacción de los votantes que importa es cómo los políticos gobiernan, y eso solo se puede medir en varios puntos discretos en el tiempo, con algún tipo de sistema de ponderación que ajuste los niveles actuales de satisfacción por satisfacción en otros puntos en el tiempo . La satisfacción con los resultados no tiene sentido hasta que los políticos ganadores tengan un historial significativo de acción.

Entonces parece que tienes datos sobre los políticos actuales. Con suerte, se trata de datos relevantes que han demostrado ser significativos. Puede ayudar a modelar las respuestas de los votantes.

También tienes esta idea de votantes virtuales. No sé si modelará las opciones de una población de votación hipotética, dado el conocimiento general sobre esa población, o si establecerá votantes individuales hipotéticos y verá cómo hacen elecciones para el conjunto específico de políticos con diferentes votos. reglas.

Supongo que está viendo cosas como una elección binaria, vs votar por partido, vs registrarse en primera, segunda y tercera elección, vs algún otro mecanismo de votación.

Tienes muchas partes móviles aquí. Los políticos, los votantes y los sistemas de votación son todas variables que interactúan. Para mí, esto parece un modelo de ecuación estructural. No estoy familiarizado con todos los modelos que llevan el nombre de personas que no conozco, por lo que no sé qué hacen ni para qué sirven. Pero establecí modelos separados para cada parte del sistema: políticos, votantes, sistemas de votación, y luego descubrí cómo unirlos para ver la interacción.

Además, me gustaría aclarar las preguntas de investigación que le interesan. No estoy seguro de cuánto tiempo ha estado investigando esto, pero dada la confusión de su pregunta, tendría que decirle ‘ re bastante temprano. Eso significa una revisión más iluminada y también un conocimiento más general de las herramientas estadísticas. No creo que estés en el escenario para pensar en modelos específicos. En cualquier caso, es probable que construyas el tuyo específicamente para tus intereses de investigación. Por lo tanto, concéntrese en comprender exactamente qué es lo que está tratando de averiguar, cuáles son los componentes y cómo puede describirlos. Creo que si describe bien las partes móviles, los métodos que necesitará para analizarlos serán mucho más claros.

Ningún modelo sería justo a menos que la muestra sea una representación adecuada de toda la población. En caso afirmativo, la regresión lineal sería suficiente.