07.10.2021

Intervalos de confianza. Probabilidad de confianza e intervalo de confianza Un intervalo de confianza representa en estadística


Para la gran mayoría de las mediciones simples, la llamada ley normal de los errores aleatorios se cumple bastante bien ( Ley de Gauss), derivado de las siguientes disposiciones empíricas.

1) los errores de medición pueden tomar una serie continua de valores;

2) con un gran número de mediciones, errores de la misma magnitud, pero de diferente signo, ocurren con la misma frecuencia,

3) cuanto mayor sea el error aleatorio, menor será la probabilidad de que ocurra.

El gráfico de la distribución gaussiana normal se muestra en la Fig.1. La ecuación de la curva tiene la forma

donde es la función de distribución de errores aleatorios (errores), que caracteriza la probabilidad de un error, σ es la raíz del error cuadrático medio.

El valor σ no es una variable aleatoria y caracteriza el proceso de medición. Si las condiciones de medición no cambian, entonces σ permanece constante. El cuadrado de esta cantidad se llama dispersión de medidas. Cuanto menor sea la dispersión, menor será la dispersión de los valores individuales y mayor será la precisión de la medición.

Se desconoce el valor exacto del error cuadrático medio σ, así como el valor real de la cantidad medida. Existe una llamada estimación estadística de este parámetro, según la cual el error cuadrático medio es igual al error cuadrático medio de la media aritmética. cuyo valor está determinado por la fórmula

donde esta el resultado i-ésima dimensión; - media aritmética de los valores obtenidos; norte es el número de medidas.

Cuanto mayor es el número de mediciones, más pequeño y más se acerca a σ. Si el valor verdadero de la cantidad medida μ, su valor medio aritmético obtenido como resultado de las mediciones y el error absoluto aleatorio, entonces el resultado de la medición se escribirá como .

El intervalo de valores de a , en el que cae el valor real de la cantidad medida μ, se llama intervalo de confianza. Como es una variable aleatoria, el valor verdadero cae en el intervalo de confianza con una probabilidad α, que se llama probabilidad de confianza, o fiabilidad mediciones. Este valor es numéricamente igual al área del trapecio curvilíneo sombreado. (ver imagen)

Todo esto es bastante justo un número grande mediciones cuando está cerca de σ. Para encontrar el intervalo de confianza y el nivel de confianza para un pequeño número de medidas, que tratamos durante la ejecución trabajo de laboratorio, usado Distribución de probabilidad de Student. Esta es la distribución de probabilidad de una variable aleatoria llamada Coeficiente del estudiante, da el valor del intervalo de confianza en fracciones de la raíz del error cuadrático medio de la media aritmética .


La distribución de probabilidad de esta cantidad no depende de σ 2 , sino que depende esencialmente del número de experimentos norte. Con un aumento en el número de experimentos. norte La distribución de Student tiende a una distribución gaussiana.

La función de distribución está tabulada (Tabla 1). El valor del coeficiente de Student está en la intersección de la línea correspondiente al número de mediciones norte, y la columna correspondiente al nivel de confianza α

Tomando una muestra de la población, obtendremos una estimación puntual del parámetro que nos interesa y calcularemos el error estándar para indicar la precisión de la estimación.

Sin embargo, para la mayoría de los casos, el error estándar como tal no es aceptable. Es mucho más útil combinar esta medida de precisión con una estimación de intervalo para el parámetro de población.

Esto se puede hacer utilizando el conocimiento de la distribución de probabilidad teórica de la muestra estadística (parámetro) para calcular el intervalo de confianza (IC – Intervalo de confianza, DI- Intervalo de confianza) para el parámetro.

En absoluto, intervalo de confianza expande las estimaciones en ambas direcciones por un cierto múltiplo del error estándar (de un parámetro dado); los dos valores (límites de confianza) que definen el intervalo suelen estar separados por una coma y encerrados entre paréntesis.

En estadística, un intervalo de confianza(CI) es un tipo de estimación de intervalo de un parámetro de población. Es un intervalo observado (es decir, se calcula a partir de las observaciones), en principio diferente de una muestra a otra, que frecuentemente incluye el valor de un parámetro de interés no observable si se repite el experimento. La frecuencia con la que el intervalo observado contiene el parámetro está determinada por el nivel de confianza o el coeficiente de confianza. Más específicamente, el significado del término "nivel de confianza" es que, si los IC se construyen a partir de muchos análisis de datos separados de experimentos replicados (y posiblemente diferentes), la proporción de dichos intervalos que contienen el valor real del parámetro coincidirá con el valor dado. nivel de confianza. Mientras que los límites de confianza bilaterales forman un intervalo de confianza, sus contrapartes unilaterales se denominan límites (o límites) de confianza inferior/superior.


El intervalo de confianza muestra en qué rango se ubicarán los resultados de las observaciones de muestra (encuestas). Si realizamos 100 encuestas idénticas en muestras idénticas de una sola población (por ejemplo, 100 muestras de 1000 personas cada una en una ciudad con una población de 5 millones), entonces con un nivel de confianza del 95 %, 95 de 100 resultados estarán dentro de el intervalo de confianza (por ejemplo, de 28% a 32% con un valor real de 30%). Por ejemplo, el número real de residentes de la ciudad que fuman es del 30%. Si seleccionamos 1000 personas 100 veces seguidas y en estas muestras hacemos la pregunta “¿Fumas?”, en 95 de estas 100 muestras, con un intervalo de confianza del 2%, el valor será del 28% al 32%.

Fórmulas para construir intervalos de confianza con ejemplos prácticos se puede encontrar, por ejemplo, .

Interpretación de los intervalos de confianza

Al interpretar el intervalo de confianza, nos interesan las siguientes preguntas:

¿Qué tan amplio es el intervalo de confianza?

Un intervalo de confianza amplio indica que la estimación es imprecisa; estrecho indica una estimación fina.
El ancho del intervalo de confianza depende del tamaño del error estándar, que, a su vez, depende del tamaño de la muestra y, al considerar una variable numérica a partir de la variabilidad de los datos, dan intervalos de confianza más amplios que los estudios de un gran conjunto de datos. de pocas variables.

¿El CI incluye algún valor de especial interés?

Puede comprobar si el valor probable de un parámetro de población se encuentra dentro de un intervalo de confianza. Si es así, entonces los resultados son consistentes con este valor probable. Si no es así, es poco probable (para un intervalo de confianza del 95 %, la probabilidad es casi del 5 %) que el parámetro tenga este valor. ()

El intervalo de confianza nos llegó del campo de la estadística. Este es un rango definido que sirve para estimar un parámetro desconocido con un alto grado de confiabilidad. La forma más fácil de explicar esto es con un ejemplo.

Suponga que necesita investigar alguna variable aleatoria, por ejemplo, la velocidad de respuesta del servidor a la solicitud de un cliente. Cada vez que el usuario ingresa la dirección de un sitio en particular, el servidor responde con velocidad diferente. Así, el tiempo de respuesta investigado tiene un carácter aleatorio. Entonces, el intervalo de confianza le permite determinar los límites de este parámetro, y luego será posible afirmar que con una probabilidad del 95% el servidor estará en el rango que calculamos.

O necesita averiguar cuántas personas saben sobre marca comercial empresas Cuando se calcule el intervalo de confianza, será posible, por ejemplo, decir que con un 95 % de probabilidad, la proporción de consumidores que conocen esto está en el rango de 27 % a 34 %.

Estrechamente relacionado con este término está un valor como el nivel de confianza. Representa la probabilidad de que el parámetro deseado esté incluido en el intervalo de confianza. Este valor determina qué tan grande será nuestro rango deseado. Cuanto mayor sea el valor que toma, más estrecho se vuelve el intervalo de confianza, y viceversa. Por lo general, se establece en 90%, 95% o 99%. El valor del 95% es el más popular.

Este indicador también se ve afectado por la varianza de las observaciones y su definición se basa en el supuesto de que la característica en estudio obedece, dicho enunciado también se conoce como Ley de Gauss. Según él, tal distribución de todas las probabilidades de una variable aleatoria continua, que puede describirse mediante una densidad de probabilidad, se llama normal. Si la suposición sobre distribución normal resultó ser erróneo, entonces la estimación puede ser incorrecta.

Primero, averigüemos cómo calcular el intervalo de confianza para Aquí, son posibles dos casos. La dispersión (el grado de propagación de una variable aleatoria) puede o no ser conocida. Si se conoce, nuestro intervalo de confianza se calcula utilizando la siguiente fórmula:

xsr - t*σ / (raíz cuadrada(n))<= α <= хср + t*σ / (sqrt(n)), где

α - signo,

t es un parámetro de la tabla de distribución de Laplace,

σ es la raíz cuadrada de la dispersión.

Si se desconoce la varianza, se puede calcular si conocemos todos los valores de la característica deseada. Para ello se utiliza la siguiente fórmula:

σ2 = х2ср - (хр)2, donde

х2ср - el valor promedio de los cuadrados del rasgo en estudio,

(xsr)2 es el cuadrado de esta característica.

La fórmula por la cual se calcula el intervalo de confianza en este caso cambia ligeramente:

xsr - t*s / (raíz cuadrada(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - media muestral,

α - signo,

t es un parámetro que se encuentra usando la tabla de distribución de Student t \u003d t (ɣ; n-1),

sqrt(n) es la raíz cuadrada del tamaño total de la muestra,

s es la raíz cuadrada de la varianza.

Considere este ejemplo. Suponga que, con base en los resultados de 7 mediciones, se determinó que el rasgo en estudio es 30 y la varianza muestral es igual a 36. Es necesario encontrar, con una probabilidad del 99%, un intervalo de confianza que contenga el valor verdadero de el parámetro medido.

Primero, determinemos a qué es igual t: t \u003d t (0.99; 7-1) \u003d 3.71. Usando la fórmula anterior, obtenemos:

xsr - t*s / (raíz cuadrada(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (raíz cuadrada(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

El intervalo de confianza para la varianza se calcula tanto en el caso de una media conocida como cuando no hay datos sobre la expectativa matemática, y solo se conoce el valor de la estimación puntual no sesgada de la varianza. No daremos aquí las fórmulas para su cálculo, ya que son bastante complejas y, si se desea, siempre se pueden encontrar en la red.

Solo notamos que es conveniente determinar el intervalo de confianza utilizando Excel o un servicio de red, que se llama así.

En las subsecciones anteriores, consideramos la cuestión de estimar el parámetro desconocido A un número. Tal evaluación se llama "punto". En una serie de tareas, se requiere no solo encontrar el parámetro A valor numérico adecuado, sino también evaluar su precisión y fiabilidad. Se requiere saber a qué errores puede conducir la sustitución de parámetros A su estimación puntual A y ¿con qué grado de confianza podemos esperar que estos errores no vayan más allá de los límites conocidos?

Los problemas de este tipo son especialmente relevantes para un pequeño número de observaciones, cuando la estimación puntual y en es en gran medida aleatorio y una sustitución aproximada de a por a puede conducir a errores graves.

Para dar una idea de la precisión y fiabilidad de la estimación. A,

en estadística matemática se utilizan los llamados intervalos de confianza y probabilidades de confianza.

Sea para el parámetro A derivado de la experiencia estimación imparcial A. Queremos estimar el posible error en este caso. Asignemos una probabilidad p lo suficientemente grande (por ejemplo, p = 0.9, 0.95 o 0.99) tal que un evento con probabilidad p pueda considerarse prácticamente seguro, y encontremos un valor de s para el cual

Entonces el rango de valores prácticamente posibles del error que ocurre al reemplazar A en A, será ± s; grandes errores absolutos aparecerán solo con una pequeña probabilidad a = 1 - p. Reescribamos (14.3.1) como:

La igualdad (14.3.2) significa que con probabilidad p el valor desconocido del parámetro A cae dentro del intervalo

En este caso, cabe señalar una circunstancia. Previamente, consideramos repetidamente la probabilidad de que una variable aleatoria caiga en un intervalo no aleatorio dado. Aquí la situación es diferente: A no aleatorio, sino intervalo aleatorio / r. Aleatoriamente su posición en el eje x, determinada por su centro A; en general, la longitud del intervalo 2s también es aleatoria, ya que el valor de s se calcula, por regla general, a partir de datos experimentales. Por lo tanto, en este caso, sería mejor interpretar el valor de p no como la probabilidad de "dar" en el punto A en el intervalo / p, sino como la probabilidad de que un intervalo aleatorio / p cubra el punto A(Figura 14.3.1).

Arroz. 14.3.1

La probabilidad p se llama nivel de confianza, y el intervalo / p - intervalo de confianza. Límites de intervalo si. a x \u003d a- arena un 2 = un + y se llaman límites de confianza.

Démosle una interpretación más al concepto de intervalo de confianza: puede considerarse como un intervalo de valores de parámetros A, compatible con los datos experimentales y que no los contradiga. De hecho, si aceptamos considerar un evento con una probabilidad a = 1-p prácticamente imposible, entonces aquellos valores del parámetro a para los cuales un - un> s deben ser reconocidos como contradictorios con los datos experimentales, y aquellos para los cuales |a - A en t na 2 .

Sea para el parámetro A hay una estimación imparcial A. Si conociéramos la ley de distribución de la cantidad A, el problema de encontrar el intervalo de confianza sería bastante simple: bastaría con encontrar un valor de s para el cual

La dificultad radica en el hecho de que la ley de distribución de la estimación A depende de la ley de distribucion de la cantidad X y, en consecuencia, sobre sus parámetros desconocidos (en particular, sobre el propio parámetro A).

Para sortear esta dificultad, se puede aplicar el siguiente truco aproximado: reemplazar los parámetros desconocidos en la expresión de s con sus estimaciones puntuales. Con un número relativamente grande de experimentos PAG(alrededor de 20 ... 30) esta técnica suele dar resultados satisfactorios en términos de precisión.

Como ejemplo, considere el problema del intervalo de confianza para la expectativa matemática.

dejar producido PAG X, cuyas características son la esperanza matemática T y varianza D- desconocido. Para estos parámetros se obtuvieron las siguientes estimaciones:

Se requiere construir un intervalo de confianza / р, correspondiente a la probabilidad de confianza р, para la expectativa matemática T cantidades X.

Para resolver este problema, usamos el hecho de que la cantidad T es la suma PAG variables aleatorias independientes distribuidas idénticamente X h y de acuerdo con el teorema del límite central para suficientemente grande PAG su ley de distribución es cercana a la normal. En la práctica, incluso con un número relativamente pequeño de términos (del orden de 10 ... 20), la ley de distribución de la suma puede considerarse aproximadamente normal. Supondremos que el valor T distribuidos de acuerdo con la ley normal. Las características de esta ley - la expectativa matemática y la varianza - son iguales, respectivamente T Y

(ver capítulo 13 subsección 13.3). Supongamos que el valor D conocemos y encontramos un valor Ep para el cual

Aplicando la fórmula (6.3.5) del Capítulo 6, expresamos la probabilidad del lado izquierdo de (14.3.5) en términos de la función de distribución normal

donde es la desviación estándar de la estimación t

De la ecuación

encontrar el valor Sp:

donde arg Ф* (x) es la función inversa de Ф* (X), aquellos. tal valor del argumento para el cual la función de distribución normal es igual a X.

Dispersión D, a través del cual se expresa el valor A 1P, no lo sabemos exactamente; como su valor aproximado, puede utilizar la estimación D(14.3.4) y poner aproximadamente:

Así, se resuelve aproximadamente el problema de construir un intervalo de confianza, el cual es igual a:

donde gp se define por la fórmula (14.3.7).

Para evitar la interpolación inversa en las tablas de la función Ф * (l) al calcular s p, es conveniente compilar una tabla especial (Tabla 14.3.1), que enumera los valores de la cantidad

dependiendo de R. El valor (p determina para la ley normal el número de desviaciones estándar que deben reservarse a la derecha y a la izquierda del centro de dispersión para que la probabilidad de caer en el área resultante sea igual a p.

A través del valor de 7 p, el intervalo de confianza se expresa como:

Tabla 14.3.1

Ejemplo 1. Se realizaron 20 experimentos sobre el valor X; los resultados se muestran en la tabla. 14.3.2.

Tabla 14.3.2

Se requiere encontrar una estimación de para la expectativa matemática de la cantidad X y construya un intervalo de confianza correspondiente a un nivel de confianza p = 0,8.

Solución. Tenemos:

Eligiendo por el origen n: = 10, según la tercera fórmula (14.2.14) encontramos la estimación insesgada D :

Según la tabla 14.3.1 encontramos

Límites de confianza:

Intervalo de confianza:

Valores paramétricos T, que se encuentran en este intervalo son compatibles con los datos experimentales que figuran en la tabla. 14.3.2.

De manera similar, se puede construir un intervalo de confianza para la varianza.

dejar producido PAG experimentos independientes en una variable aleatoria X con parámetros desconocidos de y A, y para la varianza D se obtiene la estimación insesgada:

Se requiere construir aproximadamente un intervalo de confianza para la varianza.

De la fórmula (14.3.11) se puede ver que el valor D representa

cantidad PAG variables aleatorias de la forma . Estos valores no son

independientes, ya que cualquiera de ellos incluye la cantidad T, dependiente de todos los demás. Sin embargo, se puede demostrar que como PAG la ley de distribución de su suma también es cercana a la normal. casi en PAG= 20...30 ya se puede considerar normal.

Supongamos que esto es así, y busquemos las características de esta ley: la esperanza matemática y la varianza. Desde la puntuación D- imparcial, entonces M[D] = D.

Cálculo de varianza D D está asociado a cálculos relativamente complejos, por lo que damos su expresión sin derivación:

donde c 4 - el cuarto momento central de la cantidad X.

Para usar esta expresión, debe sustituir en ella los valores de 4 y D(al menos aproximado). En lugar de D puedes usar la evaluacion D. En principio, el cuarto momento central también puede ser reemplazado por su estimación, por ejemplo, por un valor de la forma:

pero tal reemplazo dará una precisión extremadamente baja, ya que en general, con un número limitado de experimentos, los momentos de alto orden se determinan con grandes errores. Sin embargo, en la práctica sucede a menudo que la forma de la ley de distribución de la cantidad X conocido de antemano: sólo se desconocen sus parámetros. Entonces podemos tratar de expresar u4 en términos de D.

Tomemos el caso más común, cuando el valor X distribuidos de acuerdo con la ley normal. Entonces su cuarto momento central se expresa en términos de la varianza (ver Capítulo 6 Subsección 6.2);

y la fórmula (14.3.12) da o

Reemplazando en (14.3.14) la incógnita D su evaluación D, obtenemos: de donde

El momento u 4 se puede expresar en términos de D también en algunos otros casos, cuando la distribución de la cantidad X no es normal, pero su apariencia es conocida. Por ejemplo, para la ley de densidad uniforme (ver Capítulo 5) tenemos:

donde (a, P) es el intervalo en el que se da la ley.

Por eso,

De acuerdo con la fórmula (14.3.12) obtenemos: de donde encontramos aproximadamente

En los casos en que se desconozca la forma de la ley de distribución del valor de 26, al estimar el valor de a /) todavía se recomienda usar la fórmula (14.3.16), si no hay motivos especiales para creer que esto ley es muy diferente de la normal (tiene una marcada curtosis positiva o negativa) .

Si el valor aproximado de a/) se obtiene de una forma u otra, entonces es posible construir un intervalo de confianza para la varianza de la misma forma que lo construimos para la esperanza matemática:

donde el valor que depende de la probabilidad dada p se encuentra en la Tabla. 14.3.1.

Ejemplo 2. Hallar un intervalo de confianza de aproximadamente el 80 % para la varianza de una variable aleatoria X bajo las condiciones del ejemplo 1, si se sabe que el valor X distribuidos de acuerdo con una ley cercana a la normal.

Solución. El valor sigue siendo el mismo que en la Tabla. 14.3.1:

Según la fórmula (14.3.16)

Según la fórmula (14.3.18) encontramos el intervalo de confianza:

El rango correspondiente de valores de la desviación estándar: (0.21; 0.29).

14.4. Métodos exactos para construir intervalos de confianza para los parámetros de una variable aleatoria distribuida según la ley normal

En la subsección anterior, consideramos métodos aproximadamente aproximados para construir intervalos de confianza para la media y la varianza. Aquí damos una idea de los métodos exactos para resolver el mismo problema. Resaltamos que para encontrar con precisión los intervalos de confianza, es absolutamente necesario conocer de antemano la forma de la ley de distribución de la cantidad X, mientras que esto no es necesario para la aplicación de métodos aproximados.

La idea de métodos exactos para construir intervalos de confianza es la siguiente. Cualquier intervalo de confianza se encuentra a partir de una condición que expresa la probabilidad de cumplimiento de ciertas desigualdades, que incluyen la estimación que nos interesa. A. Ley de distribución de calificaciones A en el caso general depende de los parámetros desconocidos de la cantidad X. Sin embargo, a veces es posible pasar desigualdades de una variable aleatoria A a alguna otra función de los valores observados X p X 2, ..., X pág. cuya ley de distribución no depende de parámetros desconocidos, sino que depende solo del número de experimentos y de la forma de la ley de distribución de la cantidad X. Las variables aleatorias de este tipo juegan un papel importante en las estadísticas matemáticas; han sido estudiados con más detalle para el caso de una distribución normal de la cantidad X.

Por ejemplo, se ha probado que bajo una distribución normal de la cantidad X valor aleatorio

sujeto a los llamados ley de distribucion del estudiante Con PAG- 1 grados de libertad; la densidad de esta ley tiene la forma

donde G(x) es la función gamma conocida:

También se demuestra que la variable aleatoria

tiene "distribución % 2 " con PAG- 1 grados de libertad (ver capítulo 7), cuya densidad se expresa mediante la fórmula

Sin detenernos en las derivaciones de las distribuciones (14.4.2) y (14.4.4), mostraremos cómo se pueden aplicar al construir intervalos de confianza para los parámetros Ty D.

dejar producido PAG experimentos independientes en una variable aleatoria X, distribuidos de acuerdo con la ley normal con parámetros desconocidos TÍO. Para estos parámetros, las estimaciones

Se requiere construir intervalos de confianza para ambos parámetros correspondientes a la probabilidad de confianza p.

Primero construyamos un intervalo de confianza para la expectativa matemática. Es natural tomar este intervalo simétrico con respecto a T; denote por s p la mitad de la longitud del intervalo. El valor de sp debe elegirse de modo que la condición

Intentemos pasar por el lado izquierdo de la igualdad (14.4.5) de una variable aleatoria T a una variable aleatoria T, distribuidos de acuerdo con la ley de Student. Para ello, multiplicamos ambas partes de la desigualdad |m-w?|

a un valor positivo: o, usando la notación (14.4.1),

Encontremos un número / p tal que el valor / p se pueda encontrar a partir de la condición

De la fórmula (14.4.2) se puede ver que (1) es una función par, por lo que (14.4.8) da

La igualdad (14.4.9) determina el valor /p en función de p. Si tienes a tu disposición una tabla de valores integrales

entonces el valor / p se puede encontrar por interpolación inversa en la tabla. Sin embargo, es más conveniente compilar una tabla de valores / p por adelantado. Tal tabla se da en el Apéndice (Tabla 5). Esta tabla muestra los valores en función de la probabilidad de confianza p y el número de grados de libertad PAG- 1. Habiendo determinado / p según la tabla. 5 y suponiendo

encontramos la mitad del ancho del intervalo de confianza / p y el propio intervalo

Ejemplo 1. Se realizaron 5 experimentos independientes sobre una variable aleatoria X, distribuida normalmente con parámetros desconocidos T y sobre Los resultados de los experimentos se dan en la tabla. 14.4.1.

Tabla 14.4.1

Encuentre una estimación T para la expectativa matemática y construya un intervalo de confianza del 90% / p para ello (es decir, el intervalo correspondiente a la probabilidad de confianza p \u003d 0.9).

Solución. Tenemos:

Según el cuadro 5 de la solicitud de PAG - 1 = 4 y p = 0.9 encontramos dónde

El intervalo de confianza será

Ejemplo 2. Para las condiciones del ejemplo 1 del inciso 14.3, asumiendo el valor X distribuida normalmente, encuentre el intervalo de confianza exacto.

Solución. Según la tabla 5 de la solicitud, encontramos en PAG - 1 = 19ir =

0,8/p = 1,328; de aquí

Comparando con la solución del ejemplo 1 de la subsección 14.3 (e p = 0.072), vemos que la discrepancia es muy pequeña. Si mantenemos la precisión al segundo decimal, entonces los intervalos de confianza encontrados por los métodos exacto y aproximado son los mismos:

Pasemos a construir un intervalo de confianza para la varianza. Considere la estimación de la varianza imparcial

y expresar la variable aleatoria D a través del valor V(14.4.3) con distribución x 2 (14.4.4):

Conociendo la ley de distribución de la cantidad v, es posible encontrar el intervalo / (1 ) en el que cae con una probabilidad dada p.

ley de distribucion k n _ x (v) el valor de I 7 tiene la forma que se muestra en la fig. 14.4.1.

Arroz. 14.4.1

Surge la pregunta: ¿cómo elegir el intervalo / p? Si la ley de distribución de la cantidad V fuera simétrica (como una ley normal o la distribución de Student), sería natural tomar el intervalo /p simétrico con respecto a la esperanza matemática. En este caso, la ley k n _ x (v) asimétrico. Acordemos elegir el intervalo /p de modo que las probabilidades de salida de la cantidad V fuera del intervalo a la derecha y a la izquierda (áreas sombreadas en la Fig. 14.4.1) eran iguales e iguales

Para construir un intervalo / p con esta propiedad, usamos Table. 4 aplicaciones: contiene números y) tal que

por la cantidad v, que tiene una distribución x 2 con r grados de libertad. En nuestro caso r = norte- 1. Fijar r = norte- 1 y encontrar en la línea correspondiente de la tabla. 4 dos valores x2 - uno correspondiente a una probabilidad el otro - probabilidades Designemos estos

valores a las 2 Y ¿SG? El intervalo tiene y 2 , con la izquierda y y~ extremo derecho

Ahora encontramos el intervalo de confianza requerido /| para la varianza con límites D, y D2, que cubre el punto D con probabilidad p:

Construyamos tal intervalo / (, = (?> b A), que cubre el punto D si y solo si el valor V cae en el intervalo / r. Demostremos que el intervalo

satisface esta condición. De hecho, las desigualdades son equivalentes a las desigualdades

y estas desigualdades se cumplen con probabilidad p. Así, se encuentra el intervalo de confianza para la dispersión y se expresa mediante la fórmula (14.4.13).

Ejemplo 3. Encuentre el intervalo de confianza para la varianza bajo las condiciones del ejemplo 2 de la subsección 14.3, si se sabe que el valor X distribuido normalmente.

Solución. Tenemos . Según la tabla 4 de la solicitud

nos encontramos en r = norte - 1 = 19

De acuerdo con la fórmula (14.4.13) encontramos el intervalo de confianza para la dispersión

Intervalo correspondiente para la desviación estándar: (0,21; 0,32). Este intervalo solo supera ligeramente el intervalo (0.21; 0.29) obtenido en el Ejemplo 2 de la Subsección 14.3 por el método aproximado.

  • La figura 14.3.1 considera un intervalo de confianza que es simétrico con respecto a a. En general, como veremos más adelante, esto no es necesario.
Actualizado: 3 de marzo de 2020
archivo de ejemplo

Construyamos un intervalo de confianza en MS EXCEL para estimar el valor medio de la distribución en el caso de un valor conocido de la varianza.

por supuesto la eleccion nivel de confianza depende completamente de la tarea en cuestión. Por lo tanto, el grado de confianza del pasajero aéreo en la fiabilidad de la aeronave, por supuesto, debe ser mayor que el grado de confianza del comprador en la fiabilidad de la bombilla.

Formulación de tareas

Supongamos que de población haber tomado muestra tamaño nm. Se asume que Desviación Estándar esta distribución es conocida. Necesario sobre la base de este muestras evaluar lo desconocido media de distribucion(μ, ) y construya el correspondiente bilateralintervalo de confianza .

Estimación de puntos

Como se sabe de Estadísticas(vamos a llamarlo X cf) es estimación no sesgada de la media este población y tiene la distribución N(μ;σ 2 /n).

Nota : ¿Qué pasa si necesitas construir intervalo de confianza en el caso de la distribución, que no es¿normal? En este caso, viene al rescate, que dice que con un tamaño suficientemente grande muestras n de distribución no-normal , muestreo distribución de estadísticas Х av voluntad aproximadamente corresponder distribución normal con parámetros N(μ;σ 2 /n).

Entonces, punto estimadomediovalores de distribución tenemos es muestra promedio, es decir. X cf. Ahora vamos a ocuparnos intervalo de confianza.

Construcción de un intervalo de confianza

Normalmente, conociendo la distribución y sus parámetros, podemos calcular la probabilidad de que una variable aleatoria tome un valor de un intervalo dado. Ahora hagamos lo contrario: encuentre el intervalo en el que cae la variable aleatoria con una probabilidad dada. Por ejemplo, de las propiedades distribución normal se sabe que con una probabilidad del 95%, una variable aleatoria distribuida en ley ordinaria, caerá dentro del intervalo de aproximadamente +/- 2 desde valor medio(ver artículo sobre). Este intervalo servirá como nuestro prototipo para intervalo de confianza .

Ahora vamos a ver si conocemos la distribución. , calcular este intervalo? Para responder a la pregunta, debemos especificar la forma de distribución y sus parámetros.

Sabemos que la forma de distribución es distribución normal(recuerda que estamos hablando de distribución muestralEstadísticasX cf).

El parámetro μ es desconocido para nosotros (solo necesita ser estimado usando intervalo de confianza), pero tenemos su estimación X cf, calculado en base a muestra, que se puede utilizar.

El segundo parámetro es desviación estándar de la media de la muestraserá conocido, es igual a σ/√n.

Porque no sabemos μ, entonces construiremos el intervalo +/- 2 desviaciones estandar no de valor medio, pero a partir de su estimación conocida X cf. Aquellos. al calcular intervalo de confianza NO asumiremos que X cf caerá dentro del intervalo +/- 2 desviaciones estandar de μ con una probabilidad del 95%, y supondremos que el intervalo es +/- 2 desviaciones estandar de X cf con una probabilidad del 95% cubrirá μ - el promedio de la población general, a partir del cual muestra. Estas dos declaraciones son equivalentes, pero la segunda declaración nos permite construir intervalo de confianza .

Además, refinamos el intervalo: una variable aleatoria distribuida en ley ordinaria, con un 95% de probabilidad cae dentro del intervalo +/- 1.960 desviaciones estandar, no +/- 2 desviaciones estandar. Esto se puede calcular usando la fórmula \u003d NORM.ST.OBR ((1 + 0.95) / 2), cm. archivo de muestra Espaciado entre hojas .

Ahora podemos formular un enunciado probabilístico que nos servirá para formar intervalo de confianza: "La probabilidad de que media de la población ubicado desde promedio de la muestra dentro de 1.960" desviaciones estándar de la media de la muestra", es igual al 95%.

El valor de probabilidad mencionado en el enunciado tiene un nombre especial , que se asocia con nivel de significación α (alfa) mediante una expresión simple nivel de confianza = 1 . En nuestro caso Nivel significativo α =1-0,95=0,05 .

Ahora, basándonos en este enunciado probabilístico, escribimos una expresión para calcular intervalo de confianza :

donde Zα/2 estándardistribución normal(tal valor de una variable aleatoria z , Qué PAG (z >= Zα/2 )=a/2).

Nota : Cuantil α/2 superior define el ancho intervalo de confianza V desviaciones estandarmuestra promedio. Cuantil α/2 superior estándardistribución normal siempre es mayor que 0, lo cual es muy conveniente.

En nuestro caso, en α=0.05, cuantil α/2 superior es igual a 1.960. Para otros niveles de significancia α (10%; 1%) cuantil α/2 superiorZα/2 se puede calcular usando la formula \u003d NORM.ST.OBR (1-α / 2) o si se sabe nivel de confianza , =NORM.ST.OBR((1+nivel de confianza)/2) .

Por lo general, al construir intervalos de confianza para estimar la media Usar unicamente α superior /2- cuantil y no usar menor α /2- cuantil. Esto es posible porque estándardistribución normal simétrica con respecto al eje x ( densidad de su distribución simétrico sobre promedio, es decir 0) . Por lo tanto, no es necesario calcular cuantil α/2 inferior(simplemente se llama α /2-cuantil), porque es igual α superior /2- cuantil con un signo menos.

Recuerde que, independientemente de la forma de la distribución de x, la variable aleatoria correspondiente X cf repartido aproximadamenteBien N(μ;σ 2 /n) (ver artículo sobre). Por lo tanto, en general, la expresión anterior para intervalo de confianza es solo aproximada. Si x se distribuye entre ley ordinaria N(μ;σ 2 /n), entonces la expresión para intervalo de confianza es preciso.

Cálculo del intervalo de confianza en MS EXCEL

Resolvamos el problema. El tiempo de respuesta de un componente electrónico a una señal de entrada es una característica importante de un dispositivo. Un ingeniero desea trazar un intervalo de confianza para el tiempo de respuesta promedio con un nivel de confianza del 95 %. Por experiencia previa, el ingeniero sabe que la desviación estándar del tiempo de respuesta es de 8 ms. Se sabe que el ingeniero realizó 25 mediciones para estimar el tiempo de respuesta, el valor promedio fue de 78 ms.

Solución: Un ingeniero quiere saber el tiempo de respuesta de un dispositivo electrónico, pero entiende que el tiempo de respuesta no es fijo, sino una variable aleatoria que tiene su propia distribución. Entonces, lo mejor que puede esperar es determinar los parámetros y la forma de esta distribución.

Desafortunadamente, por la condición del problema, no sabemos la forma de la distribución del tiempo de respuesta (no tiene que ser normal). , esta distribución también es desconocida. solo el es conocido Desviación Estándarσ=8. Por lo tanto, aunque no podemos calcular las probabilidades y construir intervalo de confianza .

Sin embargo, aunque no conocemos la distribución tiemporespuesta separada, sabemos que según CPT , distribución muestraltiempo promedio de respuesta es aproximadamente normal(supondremos que las condiciones CPT se realizan, porque tamaño muestras suficientemente grande (n=25)) .

Además, promedio esta distribución es igual a valor medio distribuciones de respuesta unitaria, es decir, m. A Desviación Estándar de esta distribución (σ/√n) se puede calcular usando la fórmula =8/ROOT(25) .

También se sabe que el ingeniero recibió punto estimado parámetro μ igual a 78 ms (X cf). Por lo tanto, ahora podemos calcular las probabilidades, porque conocemos la forma de distribución ( normal) y sus parámetros (Х ср y σ/√n).

Ingeniero quiere saber valor esperadoμ de la distribución del tiempo de respuesta. Como se indicó anteriormente, este μ es igual a expectativa de la distribución de la muestra del tiempo de respuesta promedio. si usamos distribución normal N(X cf; σ/√n), entonces el μ deseado estará en el rango +/-2*σ/√n con una probabilidad de aproximadamente 95%.

Nivel significativo es igual a 1-0.95=0.05.

Finalmente, encuentre el borde izquierdo y derecho. intervalo de confianza. Borde izquierdo: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / RAÍZ (25) = 74,864 Borde derecho: \u003d 78 + NORMA ST.OBR (1-0.05 / 2) * 8 / RAÍZ (25) \u003d 81.136

Borde izquierdo: =INV.NORM(0.05/2, 78, 8/RAÍZ CUADRADA(25)) Borde derecho: =INV.NORM(1-0.05/2, 78, 8/RAÍZ CUADRADA(25))

Respuesta : intervalo de confianza en 95% nivel de confianza y σ =8 mseg es igual 78+/-3.136ms

EN archivo de ejemplo en hoja Sigma conocido creó un formulario para el cálculo y la construcción bilateralintervalo de confianza por arbitrario muestras con un σ dado y Nivel significativo .

Función CONFIANZA.NORMA()

Si los valores muestras están en el rango B20:B79 , A Nivel significativo igual a 0,05; luego la fórmula de MS EXCEL: =PROMEDIO(B20:B79)-CONFIANZA(0.05,σ, CONTAR(B20:B79)) devolverá el borde izquierdo intervalo de confianza .

El mismo límite se puede calcular usando la fórmula: =PROMEDIO(B20:B79)-INV.EST.NORM(1-0.05/2)*σ/SQRT(CONTAR(B20:B79))

Nota: La función TRUST.NORM() apareció en MS EXCEL 2010. Las versiones anteriores de MS EXCEL usaban la función TRUST().


2023
newmagazineroom.ru - Estados contables. UNVD. Salario y personal. Operaciones de divisas. Pago de impuestos. IVA. primas de seguro