What are the KKT conditions?

Consider an optimization problem in standard form: with the variable . Assume that the ‘s and ‘s are differentiable. (At this point, we are not assuming anything about their convexity.) As before, define the Lagrangian as the function Let and be the primal and dual optimal points respectively (i.e. points where the primal and dual […]

What are the KKT conditions?

Lagrange dual, weak duality and strong duality

Consider an optimization problem in standard form: with the variable . Let be the domain for , i.e. the intersection of the domains of the ‘s and the ‘s. Let denote the optimal value of the problem. The Lagrange dual function is the function defined as the minimum value of the Lagrangian over : The […]

Lagrange dual, weak duality and strong duality

The Lagrange dual function is always concave

Consider an optimization problem in standard form: with the variable . Let be the domain for , i.e. the intersection of the domains of the ‘s and the ‘s. The Lagrangian associated with this problem is the function defined as with domain . The Lagrange dual function is the function defined as the minimum value […]

The Lagrange dual function is always concave

General chi-square tests

Imagen tomada de Lifeder.

Statistical Odds & Ends

In this previous post, I wrote about the asymptotic distribution of the Pearson $latex chi^2$ statistic. Did you know that the Pearson $latex chi^2$ statistic (and the related hypothesis test) is actually a special case of a general class of $latex chi^2$ tests? In this post we describe the general $latex chi^2$ test. The presentation follows that in Chapters 23 and 24 of Ferguson (1996) (Reference 1). I’m leaving out the proofs, which can be found in the reference.

(Warning: This post is going to be pretty abstract! Nevertheless, I think it’s worth a post since I don’t think the idea is well-known.)

Let’s define some quantities. Let $latex Z_1, Z_2, dots in mathbb{R}^d$ be a sequence of random vectors whose distribution depends on a $latex k$-dimensional parameter $latex theta$ which lies in a parameter space $latex Theta$. $latex Theta$ is assumed to be a non-empty open subset…

View original post 696 more words

GENERALIDADES SOBRE LA TEORÍA ESTADÍSTICA DE ENCUESTAS POR MUESTREO. PARTE II

ISADORE NABI

La imagen del encabezado ha sido tomada de QuestionPro.

MUESTREO SISTEMÁTICO

ISADORE NABI

Historia y Definición Conceptual (Ochoa, 2015):

El muestreo sistemático era muy popular en el pasado, antes de que la aparición de los ordenadores hiciese trivial un problema que siempre había dado muchos quebraderos de cabeza a los investigadores: elegir individuos de forma aleatoria dentro de una muestra. En la medida en que los ordenadores nos han facilitado la tarea de generar números aleatorios, este problema ha desaparecido.

También se sigue utilizando para seleccionar individuos a lo largo del tiempo. Por ejemplo, para estudiar la satisfacción de un servicio, podemos elegir sistemáticamente encuestar a 1 de cada n clientes que nos visitan. En estas circunstancias, en las que puede existir diferente varianza entre individuos en diferentes periodos de tiempo, el muestreo sistemático puede ser incluso más preciso que el muestreo aleatorio puro.

Es una técnica dentro de la categoría de muestreos probabilísticos – y que por lo tanto requiere tener un control preciso del marco muestral de individuos seleccionables junto con la probabilidad de que sean seleccionados – consistente en escoger un individuo inicial de forma aleatoria entre la población y, a continuación, seleccionar para la muestra a cada enésimo individuo disponible en el marco muestral.

El muestreo sistemático es un proceso muy simple y que sólo requiere la elección de un individuo al azar. El resto del proceso es trivial y rápido. Los resultados que obtenemos son representativos de la población, de forma similar al muestreo aleatorio simple, siempre y cuando no haya algún factor intrínseco en la forma en que los individuos están listados que haga que se reproduzcan ciertas características poblacionales cada cierto número de individuos. Este suceso es realmente poco frecuente.

Pasos (QuestionPro, 2022) y (QuestionPro, 2022):

  1. Es necesario desarrollar una audiencia estructural (muestra) definida para que el investigador comience a trabajar en el aspecto del muestreo.
  2. El investigador a cargo debe determinar el tamaño de la muestra ideal, es decir, cuántas personas de la población completa se van a elegir.
  3. La clave para obtener resultados precisos razonables y prácticos es tener una audiencia grande. Por ejemplo, si una ONG busca formar un muestreo sistemático de 500 voluntarios de una población de 5000, puede seleccionar a cada décima persona de la población (esto es básicamente de lo que se trata el muestreo sistemático).
  4. Una vez que se decida el número de tamaño de la muestra, se debe asignar un número a cada miembro de la muestra.
  5. Decide cuál será el intervalo de esta muestra. Este es básicamente la distancia estándar entre los elementos. Específicamente, el intervalo de muestreo (i) se calcula dividiendo el número de elementos en el marco de muestreo (N) por el tamaño de la muestra específica (n). El ejemplo mencionado anteriormente sugiere que el intervalo de muestra debe ser 10, que es el resultado de la división de 5000 (N= tamaño de la población) y 500 (N = tamaño de la muestra) (i) = N/n = 5000/500 = 10. El investigador debe seleccionar miembros que cumplan con este criterio. En este caso sería una persona de cada 10.
  6. Se debe elegir un número de manera aleatoria como miembro inicial (r) de la muestra, y este intervalo se agregará al número aleatorio para seguir agregando miembros tal que r, r+i, r+2i, r+3i, … (hasta agotar el marco de muestreo) serán elementos de la muestra.

Ventajas (QuestionPro, 2022):

  1. Es extremadamente simple y conveniente para los investigadores crear, conducir y analizar las muestras.
  2. Como no es necesario enumerar a cada miembro de la muestra, el muestreo sistemático es mejor para representar a una población de manera más rápida y sencilla.
  3. Las muestras creadas se basan en la selección de miembros libre de favoritismos.
  4. En los otros métodos de muestreo hay posibilidades de que los conglomerados creados sean altamente sesgados, y esto comúnmente no sucede en el muestreo sistemático, ya que los miembros se encuentran a una distancia fija el uno del otro.
  5. El factor de riesgo involucrado en este método de muestreo es extremadamente mínimo.
  6. En caso de que haya diversos miembros de una población, el muestreo sistemático puede ser beneficioso debido a la distribución uniforme de los miembros que son seleccionados para formar una muestra.

Referencias

Ochoa, C. (5 de Mayo de 2015). Muestreo probabilístico: muestreo sistemático. Obtenido de netquest: https://www.netquest.com/blog/es/blog/es/muestreo-sistematico

QuestionPro. (21 de Agosto de 2022). ¿Cómo realizar un muestreo sistemático? Obtenido de Investigación de Mercado: https://www.questionpro.com/blog/es/como-realizar-un-muestreo-sistematico/

QuestionPro. (21 de Agosto de 2022). Muestreo sistemático: fácil, sencillo y económico. Obtenido de Encuestas: https://www.questionpro.com/blog/es/muestreo-sistematico/

EMBEBIMIENTOS MÉTRICOS, PARTE II: ANÁLISIS DE COMPONENTES PRINCIPALES, ANÁLISIS DE CONGLOMERADOS JERÁRQUICOS Y ANÁLISIS DE CONGLOMERADOS POR K-MEDIAS APLICADOS AL ANÁLISIS CANTONAL DE INDICADORES SOBRE LA NIÑEZ Y LA VEJEZ

ISADORE NABI

INTRODUCCIÓN A LOS MODELOS DE CLASIFICACIÓN, MÉTODOS DE VALIDACIÓN, MÉTRICAS DE DESEMPEÑO Y ENSAMBLE DE MODELOS. TERCERA PARTE: CLASIFICACIÓN DE LA CALIFICACIÓN DE DEUDA DE MOODY’S DE LOS PAÍSES MEDIANTE MODELOS DE APRENDIZAJE ESTADÍSTICO

ISADORE NABI

INTRODUCCIÓN A LOS MODELOS DE CLASIFICACIÓN, MÉTODOS DE VALIDACIÓN, MÉTRICAS DE DESEMPEÑO Y ENSAMBLE DE MODELOS. SEGUNDA PARTE

ISADORE NABI

INTRODUCCIÓN A LOS MODELOS DE CLASIFICACIÓN, MÉTODOS DE VALIDACIÓN, MÉTRICAS DE DESEMPEÑO Y ENSAMBLE DE MODELOS. PRIMERA PARTE

ISADORE NABI