30. ago., 2017

ESTADISTICA DESCRIPTIVA, REGRESION LINEAL Y CORRELACION

A.     INTRODUCCION

La teoría de la confiabilidad es estadística y matemática aplicada a la ingeniería.  Esta teoría se origina  de la medicina en lo relacionado a la supervivencia[1] humana  y la ingeniería retoma tales conceptos para aplicarlos  a la supervivencia de las máquinas y sus componentes.      

El presente texto de Estadística descriptiva es parte de un conjunto de libros que conforman la carrera técnica “Ingeniería Estadística Aplicada a la Confiabilidad y Riesgo.  Es importante introducir algunos elementos técnicos  y saber diferenciar entre   “fiabilidad y confiabilidad”.   La fiabilidad es la posibilidad (en términos porcentuales) de que un subsistema, aparato o dispositivo cumpla una determinada función bajo ciertas condiciones durante un tiempo determinado.  El concepto de probabilidad lo introducimos en el módulo 3 de la carrera técnica antes comentada.  La fiabilidad se aplica a cada una de los componentes que integran un sistema[2], por ejemplo en una industria están los departamentos cuyo objetivo común es el control de calidad total hacia mejores niveles de competitividad, (aun así cada departamento es a su vez un sistema con sus respectivos componentes).  La confiabilidad se refiere al sistema en su conjunto, la cual ha logrado reunir las características necesarias para alcanzar una alta disponibilidad de sus componentes. 

Confiabilidad es un Conjunto de propiedades que describen las características de disponibilidad y los factores que la condicionan: Fiabilidad[3],  Mantenibilidad[4] y logística de Mantenimiento[5]. El fallo es un estado o situación en la que se encuentra un sistema formado por dispositivos, equipos, aparatos y/o personas en el momento que deja de cumplir la función para el cual había sido diseñado.”

La  “Teoría de la Confiabilidad” es un conjunto de teorías y métodos matemáticos  y estadísticos, procedimientos y practicas operativos que, mediante el estudio de las leyes de ocurrencia de fallos, están dirigidos a resolver problemas de previsión, estimación y optimización de la probabilidad de supervivencia, duración de vida media  y porcentaje de tiempo de buen funcionamiento de un sistema.    En el presente  la teoría de la confiabilidad  se aplica  a las ciencias sociales  y otras ramas especializadas de la ingeniería.

Hay que evitar el fallo siempre que queramos diseñar un sistema altamente fiable, competitivo y fuerte. Para ello hay que adelantarse a dicho estado o situación mediante métodos matemáticos y científicos[6].   En Ingeniería, la solución al problema del fallo requiere un análisis ex ante y ex post considerando que  "todos los sistemas llegarán a un instante en que no cumplirán satisfactoriamente aquel producto o aquella función para la cual fueron diseñados", con lo cual, fallarán. A esto lo llamaremos “fallo”. El fallo es la situación en la que entra en juego el rendimiento y la eficiencia del sistema, conllevando pérdidas en la producción, pérdidas económicas para la empresa y pérdida de tiempo disponible para seguir fabricando[7]”.

 Existe la “falla” de manera implícita” cuando el sistema de producción y de administración es ineficiente, inseguro, costoso, con alto nivel de rechazos y con aportes a una mala imagen, además los paros por fallas que paralizan la producción e inducen al paro.  La falla afecta la rentabilidad de la empresa y la calidad total en sus procesos de minimización de los errores en la toma de decisiones.

La revista digital visión industrial  define la confiabilidad como: “la probabilidad de que un equipo o sistema opere sin falla por un determinado período de tiempo, bajo unas condiciones de operación previamente establecidas.[8]” Siendo la probabilidad[9] la posibilidad de que un sistema falle.

“En la clasificación de los fallos[10]  en  un análisis del entorno, los podemos ordenar de la siguiente forma:

  • Por progresividad de degradación componentes de los que están formados los dispositivos, equipos, aparatos o incluso personas (factor fatiga o cansancio en personas).
  • Por su predecibilidad o detectabilidad.
  • Por sus consecuencias económicas u operativas.
  • Por las repercusiones en la seguridad de los usuarios.
  • Por el origen: cada fallo tiene un origen distinto y puede ser puntual o puede darse el caso de que pueda conllevar un efecto dominó en el transcurso del proceso, que podríamos decir que éste es el tipo de fallo más peligroso.”

Un programa de confiabilidad cubre todas las fases del ciclo de vida de un producto, desde la planificación hasta el funcionamiento y, eventualmente, a la retirada del servicio. Un programa de confiabilidad se compone de elementos del programa divididos en tareas. 

La falla de un producto sucede cuando deja de operar, funcionar o no realiza satisfactoriamente la función para la que fue creado. El tiempo de falla es el tiempo que transcurre hasta que el producto deja de funcionar.

Otros ejemplos de sistemas se encuentran: el sistema digestivo, el sistema nervioso, el sistema solar,  en un sistema musical sus componentes son los ejecutantes de los instrumentos, en un sistema productivo sectorial sus componentes son los productores y recursos humanos afines en actividades que generan valores agregados; la producción sectorial calificada con un valor posible relacionado a la calidad del servicio que deben proporcionar durante su tiempo de funcionamiento, para actuar con respecto a la realización de una labor pretendida en condiciones dadas durante un tiempo predeterminado y se califica con un valor[11].   Riesgo es la posibilidad porcentual de que evento no deseable ocurra.

Un Modelo de confiabilidad y supervivencia es un conjunto de relaciones  entre de variables que pueden comprobarse empíricamente.    Es una representación simplificada de un fenómeno de la ingeniería ligada a la supervivencia de un sistema y sus componentes hacia un objetivo común  legado al control de calidad total esta representación es valorada o cuantificada mediante un conjunto de relaciones teórica-empíricas.  Los modelos se utilizan para tomar decisiones y de acuerdo a la información que se disponga, se clasifican en:   Modelos en condiciones de certeza,   Modelos en condiciones de riesgo, y    Modelos en condiciones de incertidumbre [12].

Los modelos en condiciones de certeza  presenta situaciones ideales para la toma de decisiones. Se tiene la total seguridad sobre lo que va a ocurrir en el futuro. Desde un punto de vista estrictamente de la ingeniería estadística se trata de elegir el curso de acción que va a proporcionar los mejores resultados y el error entre la teoría y la realidad es cero.   Por ejemplo en el modelo de  Desgaste  en función de la velocidad de giro   denotada por  Desgaste = f(velocidad de giro)  la variable  velocidad explica completamente el proceso de desgaste de un  sistema.

 Los modelos en condiciones de certeza, caracterizado por     disponer información completa  sobre la  problemática a  resolver;  en este tipo de modelo, el error entre la teoría  y la realidad es nula  o cero.

 Tradicionalmente, los riesgos y la incertidumbre se deben a diferentes grados de falta de conocimiento respecto al estado de la naturaleza[13]. Cuando no se conoce dicho estado, pero existen evidencias objetivas o empíricas que permiten al encargado de tomar decisiones asignar posibilidades de ocurrencia (probabilidades) a los diversos estados posibles de las fallas de un sistema, el proceso de hacerlo así para llegar a la decisión se denomina toma de decisiones en condiciones de riesgo. Cuando no se conocen los estados  totales de la naturaleza, o se dispone de información parcial de la población en estudio sobre sus probabilidades de aparición, el proceso de decisión se denomina toma de decisiones bajo incertidumbre.

No obstante, incluso con incertidumbre, un encargado de tomar decisiones, según los especialistas en estadística que pertenecen a la escuela bayesiana, pue­de asignar de acuerdo a la recolección de los datos sobre fallas de un sistema, posibilidades de ocurrencia  a los estados de la naturaleza como ayuda para llegar a una decisión, y en este proceso la experiencia de los jefes de mantenimiento o posibilidades de ocurrencia de las fallas de manera subjetiva (experiencia del equipo de mantenimiento) permite disponer de cierta información para estimar las futuras fallas de un sistema.  Una vez que se asignan posibilidades de ocurrencia al estado de la naturaleza, el procedimiento de decisión es el mismo, tanto si las probabilidades son el resultado de datos empíricos, como si son puramente subjetivas. En consecuencia, con fines prácticos, los riesgos y la incertidumbre son lo mismo, y la toma de decisiones, en ambas circunstancias, la denominaremos aquí toma de decisiones con incertidumbre

 

En general, la incertidumbre es una expresión de alguna deficiencia en la información. (Ayyub, Klir, 2006[14]).

 El riesgo es la posibilidad de que  un evento no deseable ocurra.   Los modelos en condiciones de riesgo se caracterizan para evaluar la futura falla  que atenta contra la supervivencia de un sistema

  Los modelos en condiciones de riesgo; se dispone de información   parcial sobre el problema a resolver,  se conocen las              variables estadísticas obtenidas de series de tiempo con sus       distribuciones de probabilidad;  el  error entre la teoría y       la realidad.  Si el error es cero, estamos en el caso 1.   A  medida que este error sea mas   pequeño mejora su aplicación.  Estos tipos de modelo puede subdividirse en econométricos propiamente dichos y modelos de  decisión en donde los parámetros de algunas relaciones pueden  ser calculadas por métodos econométricos, sin embargo estos parámetros pueden modificarse si se desea cambios de tendencia en el comportamiento de las variables en estudio mediante aplicaciones políticas, o se disponen de un intervalo de confianza para el parámetro..  

Los Modelos en condiciones de incertidumbre; se dispone de poca        información sobre la problemática a resolver,  las variables  a   utilizar   no presentan distribuciones de probabilidad sin   embargo esto no significa que se desconozca la existencia del   problema y sus posibles soluciones alternas; entre ellos se  encuentran los modelos de la teoría de juegos[15].

El presente texto  pertenece a una colección de documentos de estadística y sus aplicaciones al control de calidad, confiabilidad y supervivencia.  Temas   ligados con textos de econometría en aplicaciones a modelos de costos en varias variables que involucran aplicaciones del cálculo diferencial e integral, otros temas interrelacionados con la teoría de conjuntos, teoría de la probabilidad y algebra de Boole.  De por si, la econometría es básica en aplicaciones de series de tiempo ligados a los fallos en modelos paramétricas  y modelos cualitativos no paramétricas mediante aplicaciones de variables categóricas cubiertas del subjetivismo del investigador respecto al ordenamiento de los valores cualitativos.  Además  el  presente trabajo, ha surgido de la necesidad de contar con  libros de estadística en sus diversas aplicaciones a  la ingeniería de confiabilidad y riesgo.  Aplicaciones a la ingeniería matemática, finanzas y otras ciencias sociales.   Esta colección de libros que se inicia con estadística descriptiva y bases de datos para aplicaciones de paquetes estadísticos como el Minitab que contiene aplicaciones de datos en control de calidad, fiabilidad y supervivencia, aplicaciones del SPSS en análisis de modelos de  varias relaciones (ecuaciones) en decisiones para el mantenimiento preventivo-.  De la manera anterior en la parte B  establecemos la interacción primaria entre la estadística descriptiva, fiabilidad y las computadoras  mediante las bases de datos que permiten convertir encuestas en variables respuestas.   Las variables generan estructuras de base de datos que pueden trasladarse a paquetes estadísticos que facilitan los análisis de datos hacia la construcción de modelos que permiten optimizar los procesos de toma de decisiones.  En la parte C  presentamos las tablas de frecuencia interactuando con paquetes estadísticos y videos.  En la parte  D   presentamos las medidas de posición y tendencia central extendible a las medidas de dispersión en la parte E  con el uso de software estadísticos y videos de YOUTUBE respectivamente.  En la parte  F  estudiamos  las medidas de forma  con videos y software.  En la parte  G  las representaciones graficos con el SPSS y MINITAB.   En la parte  H  estudiamos la medición de escalas.  En la parte  I  analizamos las relaciones entre dos variables y las tablas de contingencia con el SPSS extendible en la parte J  a las relaciones lineales y no lineales cubriéndose la correlacion  la covarianza, con videos.  En la parte  K  se cubre  el coeficiente de determinación  y en la parte  L  se estudian las bases de datos avanzados con videos.   En la parte  M  la metodología de la investigación y fiabilidad con el uso de videos  y  en la  parte  N   presentamos la Bibliografía.

TABLA DE CONTENIDO

 

 

 

Tema

A

 

 

INTRODUCCION

 

 

 

.

B

 

 

ESTADISTICA Y SUS APLICACIONES A LA FIABILIDAD

 

I

 

LOS DATOS ESTADISTICOS: POBLACION Y MUESTRA

 

II

 

TIPOS DE DATOS Y APLICACIONES EN EL MINITAB Y SPSS

 

III

 

 MINITAB Y SPSS  EN EL MANEJO DE BASES DE DATOS

 

IV

 

 

 EJEMPLO DE UNA VARIABLE CATEGORICA SOBRE FALLAS

 

V

 

VIDEOS DE BASES DE DATOS CON EL PAQUETE ESTADISTICO SPSS

 

VI

 

 VIDEOS DE BASES DE DATOS CON EL MINITAB

 

VII

 

 VIDEOS TALLER DE BASES DE DATOS

 

 

 

 

C

 

 

TABLAS DE FRECUENCIA EN FIABILIDAD

 

I

 

VARIABLES CATEGORICAS Y NUMERICAS DISCRETAS

 

 

1

VIDEOS DE FRECUENCIA CON EL SPSS

 

 

2

ANALISIS DE DATOS EN FIABILIDAD

 

II

 

VARIABLES NUMERICAS CONTINUAS

 

III

 

TABLAS DE FRECUENCIA PARA VALORES CONTINUOS

 

 

1

VIDEOS SOBRE INTERVALOS Y DATOS AGRUPADOS

 

 

 

.

D

 

 

LAS MEDIDAS DE POSICION, TENDENCIA CENTRAL Y DISPERSION DE VARIABLES NUMERICAS

 

I

 

LAS MEDIDAS DE POSICION: PERCENTILES Y CUARTILES

 

 

1

VIDEOS DE PERCENTILES Y CUARTILES

 

II

 

MEDIDAS DE TENDENCIA CENTRAL: MEDIA MEDIANA Y MODA

 

 

1

VIDEOS DE LAS MEDIDAS DE TENDENCIA CENTRAL

 

III

 

LA MEDIA GEOMETRICA

 

 

1

VIDEOS DE LA MEDIA GEOMETRICA

 

 

2

VIDEOS DE ESTADISTICA DESCRIPTIVA

 

IV

 

CARACTERISTICAS DE LAS MEDIDAS DE TENDENCIA CENTRAL

 

 

 

.

E

 

 

 LAS MEDIDAS DE DISPERSION

 

I

 

LA VARIANZA Y LA DESVIACION ESTANDAR

 

 

1

VIDEOS SOBRE EL CALCULO DE LA VARIANZA Y LA DESVIACION ESTANDAR

 

II

 

EL COEFICIENTE DE VARIACION

 

III

 

EL RANGO Y RANGO INTERCUARTILICO

 

 

 

 

F

 

 

MEDIDAS DE FORMA

 

I

 

EL COEFICIENTE DE ASIMETRIA

 

 

1

LOS TIPOS DE ASIMETRIA

 

 

2

VIDEOS DE ASIMETRIA

 

II

 

EL COEFICIENTE DE APUNTAMIENTO  (CURTOSIS)

 

 

1

VIDEOS SOBRE EL CALCULO DE ASIMETRIA Y CURTOSIS

 

 

 

.

G

 

 

  REPRESENTACIONES GRAFICAS CON EXCEL, SPSS Y MINITAB

 

I

 

LOS DIAGRAMAS DE BARRA,  SECTORES, CIRCULARES,  POLIGONALES Y DE CAJA (BLOXPLOT)

 

 

1

DIAGRAMAS DE BARRA

 

 

2

DIAGRAMAS DE SECTORES Y CIRCULARES

 

 

3

EL HISTOGRAMA

 

 

4

EL POLIGONO DE FRECUENCIAS

 

 

5

EL POLIGONO DE FRECUENCIAS ACUMULADAS

 

 

6

EL DIAGRAMA DE CAJA Y BIGOTES (BOXPLOT)

 

 

7

VIDEOS  DE  DIAGRAMA DE CAJA Y BIGOTES

 

II

 

VIDEOS DE REPRESENTACIONES GRAFICAS CON EL SPSS, SPSS Y MINITAB

 

 

 

.

H

 

 

MEDICION DE ESCALAS: EN VARIABLES CATEGORICAS Y NUMERICAS

 

I

 

LA ESCALA DE LIKER  Y LAS VARIABLES CATEGORICAS

 

 

1

VIDEOS DE LA ESCALA DE LIKER

 

II

 

LAS ESCALAS NUMERICAS

 

 

1

EL CAMBIO DE ESCALA LINEAL

 

 

2

LA TRASLACION

 

 

3

LA TIPIFICACION

 

 

 

 

I

 

 

LA ESTADISTICA DESCRIPTIVA PARA DOS VARIABLES Y LAS TABLAS DE CONTINGENCIA

 

 

 

.

J

 

 

RELACIONES LINEALES Y NO LINEALES

 

I

 

LOS MODELOS NO LINEALES MEDIANTE EL SPSS

 

II

 

LOS MODELOS LINEALES:  LA REGRESION LINEAL, LA COVARIANZA  Y LA CORRELACION LINEAL

 

 

1

LA REGRESION LINEAL

 

III

 

LA COVARIANZA Y EL COEFICIENTE DE CORRELACION

 

IV

 

UNA INTERPRETACION GEOMETRICA DE LA COVARIANZA

 

V

 

IMÁGENES DE LA CORRELACION LINEAL

 

VI

 

LA CORRELACION  Y LA CAUSALIDAD

 

VII

 

VIDEOS DE CORRELACION Y CAUSALIDAD

 

VIII

 

VIDEOS DE CORRELACION LINEAL Y CORRELACION

 

 

 

 

K

 

 

EL COEFICIENTE DE DETERMINACION  Y  VIDEOS

L

 

 

VIDEOS DE BASES DE DATOS AVANZADOS

 

 

 

 

M

 

 

METODOLOGIA DE LA INVESTIGACION Y VIDEOS

 

 

 

 

N

 

 

BIBLIOGRAFIA

 

 

 

 

 



[1]http://www.cancer.net/es/sobrevivencia

http://new.medigraphic.com/cgi-bin/resumen.cgi?IDARTICULO=18524

http://www.medintensiva.org/es/factores-predictivos-supervivencia-durante-reanimacion/articulo/13060074/     «supervivencia», definida como: ‘Acción y efecto de sobrevivir’, sobrevivir es más extensivo hacia otras personas, por ejemplo, le sobrevivieron sus hijos. Ver el enlace   http://articulos.sld.cu/cimeq/?p=6320

 

[2]Siendo un sistema un conjunto de componentes que interactúan hacia un objetivo común.

[7] Antes citado.

[9] En el módulo 3  del presente taller en  Ingeniería Estadística  aplicada a la confiabilidad y Riesgo  “TEORIA DE LA PROBABILIDAD EN LA FIABILIDAD”  presenta  interesantes detalles y aplicaciones de esta teoría fundamental en los procesos de toma de decisiones.

[12] Ver, introducción a la TEORIA DE LAS DECISIONES, por Jean          Paul Rheault, Editorial LIMUSA, edición 1982, México, D. F.         México.

[13] Ver  LOS MODELOS EN DECISIONES GERENCIALES.   CIMES  IICES.   Autor  José  Salomón Perdomo Mejía.   San Pedro Sula Honduras  C. A.

 

[15] Ver capítulo 10, Teoría de decisiones y juegos; del texto         "Investigación de Operaciones", por Henry A. Taha, editorial         Representaciones y servicios de Ingeniería, México.