Cálculo de Reservas: Métodos estadísticos parte 1
El cálculo de reservas de hidrocarburos ha sido desde un principio uno de los principales problemas que ha tenido el ingeniero de yacimiento, esto se debe al inmenso número de variables aleatorias que posee cada sistema yacimiento como por ejemplo: porosidad, saturación, permeabilidad, presión, temperatura, entre otros. La labor entonces del ingeniero en petróleo es obtener mediante la implementación métodos numéricos avanzados, un valor aproximado de la cantidad de petróleo extraible en determinado volumen de control.
La estadística ha jugado gran importancia en todas las áreas de la ingeniería, esto se debe primordialmente a las toma de decisiones que realiza el ingeniero, decisiones que son influenciadas por una cierta cantidad de datos y variables proporcionadas por esta ciencia aplicada.
En artículos anteriores se describió como Havlena-Odeh descubrieron un método que permitía determinar el petróleo original en sitio de un yacimiento determinado mediante la linealización de unos ciertos parámetros, este método es netamente estadístico y de gran importancia para la ingeniería de yacimiento. Se utilizo un método conocido como regresión lineal por mínimos cuadrados.
En el siguiente artículo continuaré destacando aspectos importantes de la estadística que serán bases para el calculo de reservas de hidrocarburos.
Este artículo fue un resumen de mi autoria basado en las clases del profesor Ángel da Silva y lectura de diversas paginas Web relacionas con la estadística.
La estadística ha jugado gran importancia en todas las áreas de la ingeniería, esto se debe primordialmente a las toma de decisiones que realiza el ingeniero, decisiones que son influenciadas por una cierta cantidad de datos y variables proporcionadas por esta ciencia aplicada.
En artículos anteriores se describió como Havlena-Odeh descubrieron un método que permitía determinar el petróleo original en sitio de un yacimiento determinado mediante la linealización de unos ciertos parámetros, este método es netamente estadístico y de gran importancia para la ingeniería de yacimiento. Se utilizo un método conocido como regresión lineal por mínimos cuadrados.
En este artículo se definirán conceptos básicos de la estadística que son importantes en el curso de ingeniería de yacimientos y en el transcurso de nuestra profesión como ingenieros.
Estadística: es una ciencia con base matemática relacionada fundamentalmente a la recolección, análisis e interpretación de datos. La estadística busca explicar condiciones regulares en fenómenos de tipo aleatorio, como por ejemplo un yacimiento de hidrocarburos.
Universo: es la totalidad de elementos o características que conforman el ámbito de un estudio o investigación, por ejemplo los pozos productores de petróleo en Venezuela.
Población: es un conjunto finito o infinito de elementos que presentan características comunes, sobre los cuales se quiere efectuar un estudio determinado. En otras palabras, la población se define como la totalidad de los valores posibles (mediciones o conteos) de una característica específica que se desean estudiar en un momento determinado. Así, se puede hablar de la población de habitantes de un país, de la cantidad de pozos productores de petróleo en cierto campo, etc.
Muestra: es un subconjunto de la población, seleccionado de forma tal, que sea representativo de la población estudiada, obteniéndose con el objetivo de investigar alguna o algunas de las propiedades de la población de la cual se desprende. Las conclusiones que se obtengan de dicha muestra sólo podrán referirse a la población en referencia, por ejemplo la cantidad de pozos productores activos de petróleo en determinado campo.
Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Puede definirse como un método que contiene la recolección, organización, presentación y resumen de una serie de datos. El análisis que se realiza se limita en sí mismo a los datos recolectados y no se puede realizar inferencia alguna o generalizaciones acerca de la población de donde provienen esos datos estadísticos.
La estadística descriptiva consta de los siguientes pasos:
1- Selección de caracteres dignos de ser estudiados.
2 -Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres seleccionados.
3 -Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos dentro de cada carácter.
4 -Representación gráfica de los resultados (elaboración de gráficos estadísticos).
5- Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de una distribución estadística.
Estadística Inductiva: Es la rama de la estadística que apoyándose en el cálculo de probabilidades y a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. La estadística inductiva hace posible la estimación de una característica de una población o la toma de una decisión referente a una población, fundamentándose sólo en los resultados de la muestra.
La veracidad de cualquier estimación tiene una importancia enorme. Esta precisión depende en gran parte de la forma de tomar la muestra y de la atención que se ponga en que esta muestra suministre una imagen honesta de la población, pero casi nunca la muestra representa la población en toda su plenitud, y de ello resultará un error muestral.
La distribución de frecuencia: es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase.
Componentes de una distribución de frecuencia de clase:
Clase o Intervalo de clase: son divisiones en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos límites.
Punto medio o Marca de clase: es el centro de la clase. Este valor se utiliza para el cálculo de la media aritmética.
Frecuencia absoluta: se le designa con las letras fi. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.
Frecuencia relativa: es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se denotan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).
Frecuencias acumuladas: son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribución de frecuencia de clase, esto se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa.
Media (X): es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
Mediana (Md) : es una medida de posición que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parámetro que esta en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribución en una forma tal que a cada lado de la misma queda un número igual de datos.
Moda: es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las medias de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observación de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.
Desviación típica o estándar: Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que para su calculo se utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y además, se toman en cuenta los signos de esos desvíos. Se le designa con la letra S cuando se trabaja con una muestra y con la letra griega minúscula s (Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace referencia a la población él número de datos se expresa con N y cuando se refiere a la muestra él número de datos se expresa con n.
La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.
Varianza: Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviación típica; viene expresada con las mismas letras de la desviación típica pero elevadas al cuadrado, así S2 y s2. Las formulas para calcular la varianza son las mismas utilizadas por la desviación típica, exceptuando las respectivas raíces, las cuales desaparecen al estar elevados el primer miembro al cuadrado.
Una distribución de frecuencia posee la siguiente forma:Estadística: es una ciencia con base matemática relacionada fundamentalmente a la recolección, análisis e interpretación de datos. La estadística busca explicar condiciones regulares en fenómenos de tipo aleatorio, como por ejemplo un yacimiento de hidrocarburos.
Universo: es la totalidad de elementos o características que conforman el ámbito de un estudio o investigación, por ejemplo los pozos productores de petróleo en Venezuela.
Población: es un conjunto finito o infinito de elementos que presentan características comunes, sobre los cuales se quiere efectuar un estudio determinado. En otras palabras, la población se define como la totalidad de los valores posibles (mediciones o conteos) de una característica específica que se desean estudiar en un momento determinado. Así, se puede hablar de la población de habitantes de un país, de la cantidad de pozos productores de petróleo en cierto campo, etc.
Muestra: es un subconjunto de la población, seleccionado de forma tal, que sea representativo de la población estudiada, obteniéndose con el objetivo de investigar alguna o algunas de las propiedades de la población de la cual se desprende. Las conclusiones que se obtengan de dicha muestra sólo podrán referirse a la población en referencia, por ejemplo la cantidad de pozos productores activos de petróleo en determinado campo.
Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Puede definirse como un método que contiene la recolección, organización, presentación y resumen de una serie de datos. El análisis que se realiza se limita en sí mismo a los datos recolectados y no se puede realizar inferencia alguna o generalizaciones acerca de la población de donde provienen esos datos estadísticos.
La estadística descriptiva consta de los siguientes pasos:
1- Selección de caracteres dignos de ser estudiados.
2 -Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres seleccionados.
3 -Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos dentro de cada carácter.
4 -Representación gráfica de los resultados (elaboración de gráficos estadísticos).
5- Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de una distribución estadística.
Estadística Inductiva: Es la rama de la estadística que apoyándose en el cálculo de probabilidades y a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. La estadística inductiva hace posible la estimación de una característica de una población o la toma de una decisión referente a una población, fundamentándose sólo en los resultados de la muestra.
La veracidad de cualquier estimación tiene una importancia enorme. Esta precisión depende en gran parte de la forma de tomar la muestra y de la atención que se ponga en que esta muestra suministre una imagen honesta de la población, pero casi nunca la muestra representa la población en toda su plenitud, y de ello resultará un error muestral.
La distribución de frecuencia: es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase.
Componentes de una distribución de frecuencia de clase:
Clase o Intervalo de clase: son divisiones en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos límites.
Punto medio o Marca de clase: es el centro de la clase. Este valor se utiliza para el cálculo de la media aritmética.
Frecuencia absoluta: se le designa con las letras fi. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.
Frecuencia relativa: es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se denotan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).
Frecuencias acumuladas: son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribución de frecuencia de clase, esto se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa.
Media (X): es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
Mediana (Md) : es una medida de posición que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parámetro que esta en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribución en una forma tal que a cada lado de la misma queda un número igual de datos.
Moda: es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las medias de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observación de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.
Desviación típica o estándar: Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que para su calculo se utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y además, se toman en cuenta los signos de esos desvíos. Se le designa con la letra S cuando se trabaja con una muestra y con la letra griega minúscula s (Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace referencia a la población él número de datos se expresa con N y cuando se refiere a la muestra él número de datos se expresa con n.
La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.
Varianza: Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviación típica; viene expresada con las mismas letras de la desviación típica pero elevadas al cuadrado, así S2 y s2. Las formulas para calcular la varianza son las mismas utilizadas por la desviación típica, exceptuando las respectivas raíces, las cuales desaparecen al estar elevados el primer miembro al cuadrado.
En el siguiente artículo continuaré destacando aspectos importantes de la estadística que serán bases para el calculo de reservas de hidrocarburos.
Este artículo fue un resumen de mi autoria basado en las clases del profesor Ángel da Silva y lectura de diversas paginas Web relacionas con la estadística.