METODOLOGÍA Consultora Huasteca
Utilizamos el modelo de muestreo multicuotas que es una aproximación al MÉTODO PROBABILÍSTICO, ya que toma una MUESTRA ALEATORIA ESTRATIFICADA cuya distribución comporta ciertas desviaciones a la población ASEGURANDO que las personas adecuadas sean entrevistadas en las proporciones adecuadas.
Estudio multicuotas Self-Selected Sample (SSS) cuantitativo a través de cuestionarios personalizados y estructurados con el sistema CAWI (Computer-Assisted Web Interviewing) para su auto aplicación en línea y fisico utilizando el modelo de Muestreo Multicuotas Propensity Weighting que hace énfasis en la calidad de la muestra más que en la cantidad de los entrevistados estableciendo restricciones para garantizar que sólo se permita a las personas requeridas participar en cada conglomerado. Para la recolección de entrevistas los participantes son reclutados utilizando Real Time Bidding (RTB). NO se proporciona incentivos financieros ni de ningún tipo por participar en sus estudios.
La información se genera a partir de la aplicación de entrevistas personas mayores de edad residentes en la ubicación del estudio con acceso a internet en dispositivos fijos o móviles lo que permite llegar a más del 85% de la población según cifras oficiales.
MODELO DE MUESTREO
Muestreo Multicuotas Propensity Weighting que es una aproximación al método probabilístico, ya que toma una muestra aleatoria estratificada de usuarios cuya distribución comporta ciertas desviaciones a la población y donde la probabilidad de autoselección está determinada, entre otras cosas por el tamaño del interés en el estudio y por tanto está calculada de la siguiente manera:
Pr (iϵs) = Pr (Acceso internet o Fisico) * | Pr (Exposición a RTB (Real Time Bidding) * |Pr (selección│internet y RTB) * | Pr (Responde estudio | selección, internet y RTB).
CALIDAD DEL LEVANTAMIENTO
Se llevan cabo diversos controles de calidad, a cada entrevistado se le asigna una identificación única para rastrear su participación. Usamos “huellas digitales” como correo electrónico, teléfono celular, geolocalización, cookies ID e IP para garantizar que la persona que se busca sea quien responda y que no realice un estudio más de una vez. Además, el conjunto de controles de calidad evita la duplicación fraudulenta de diferentes dispositivos. Entre estos controles se emplean técnicas de “Real Answer” que identifica respuestas sospechosas o duplicadas a preguntas específicas aunado a tener controles de tiempo y tipo de cuota (segmento) por hora y recopilador (link) y controles para evitar la presencia de robots o ataques de grupos organizados, para lo cual se generan accesos distintos a cada cuota, siendo modificados cada hora, desechando las repuestas sin cumplir características de diseño, cuota y hora, generando alarmas en el subconjunto diseñado para parar el segmento específico y renovar automáticamente claves y accesos.
ESTIMACIÓN DE PROBABILIDAD
Se utilizó el enfoque de la cuasi aleatorización, ya que en los estudios no probabilísticas no se tiene control de las probabilidades por lo que se tienen que estimar calculando las probabilidades de pseudoinclusión para cada individuo en muestra no probabilística y usando ese cálculo para corregir el sesgo de selección. Dadas las estimaciones de las pseudoprobabilidades sus inversas se utilizan como ponderaciones, tal y como se hace en el muestreo probabilístico. Combinando una muestra probabilística de referencia con una no probabilística, las probabilidades de pseudoinclusión para los casos de la muestra no probabilística se estiman por un modelo de regresión logística binaria CART o por bosques aleatorios (Practical Tools for Designing and Weighting Survey Samples Richard Valliant, Springer (2018), pp. 620-620.). Para esto, se usaron las bases de la Encuesta Intercensal del INEGI, 2015. Misma que sería la muestra probabilística de referencia.
PONDERACIÓN Y CALIBRACIÓN
(Eliminando Sesgos) Los resultados NO SON FRECUENCIAS SIMPLES, sino estimaciones basadas en la post-estratificación de la muestra calculado sobre factores de expansión de acuerdo con cuatro variables demográficas (población, sexo, edad y escolaridad) obtenidas del último censo público; además de las últimas votaciones disponibles proporcionadas por los organismos oficiales en el país, así como, a ciertas variables de actitud y comportamiento como disponibilidad de teléfono fijo o religión que profesa.
PROCESAMIENTO
La información de las respuestas se almacena en servidores alojados en EUA en formato .SAV para al término del levantamiento ser descargada y pasada por filtros de congruencia interna de cada registro para después ser ponderada, procesada y tabulada por factores de expansión de acuerdo a la ponderación y calibración determinada utilizado para el procesamiento de la información es Statistical Package for the Social Sciences (SPSS®) y Tableau Software®, Flourish® y Microsoft Office® para la tabulación y graficado de los datos.