Implementé y ajusté modelos de datos de votación para mi trabajo de posgrado. Como menciona Venugopalreddy, la regresión lineal puede ser suficiente, pero si tiene datos que podrían representarse como una matriz (es decir, muchos votantes, con múltiples votos por votante), es mejor que utilice la teoría de respuesta al ítem / modelos de votación espacial (que es básicamente la factorización matricial con una respuesta logística / probit). Eche un vistazo a estas diapositivas de Kevin Quinn para obtener una descripción general: diapositivas y este documento sobre datos de lista. Pool y Rosenthol son algunos de los primeros desarrolladores de estos modelos.
No estaba del todo claro para mí cómo estás usando la comparación con el promedio; Recomendaría no transformar demasiado los datos y simplemente modelar lo que tiene con un modelo que puede manejar ese tipo de respuesta.
Con respecto a la implementación de su modelo, sugeriría algo como Metropolis Hastings o Gibbs Sampler, para que pueda implementar sus suposiciones sobre cada parte del modelo (comportamiento del votante, utilidad, etc.) con bastante facilidad como funciones separadas en su modelo. Seguí la ruta de implementar un algoritmo de optimización, que en retrospectiva obstaculizó mi capacidad de iterar rápidamente.
- ¿Qué puedo hacer con una doble especialización en relaciones internacionales y ciencias políticas de UIUC?
- ¿Cómo trataría Maquiavelo con IS?
- ¿Qué es realmente un sistema libre para las personas, la democracia (una verdadera democracia) o la anarquía?
- ¿Es la proliferación de información errónea una nueva tendencia peligrosa, y hay una falta de habilidades básicas de pensamiento crítico en una sociedad mundial moderna?
- Cómo obtener poder político
Si sus datos no se pueden enmarcar como una matriz de respuestas binarias y, en cambio, puede ser mejor una regresión más tradicional.
[Editar, después de una iteración de comentario: ver más abajo]
Veo. Si tiene el lujo de experimentar, podría imaginar un proceso generativo como este:
1.Los distritos se extraen de uno de los grupos K con probabilidad multinomial.
2. Los individuos en el distrito k provienen del grupo de k (tal vez es un gaussiano).
3. Cada individuo emite un voto basado en su ubicación y la ubicación del candidato.
Por lo tanto, un modelo espacial funciona ya que comparte información entre las personas de un distrito.