Ir al contenido

Documat


Resumen de Anàlisi de dades composicionals: conceptes bàsics i exemples en ciències aplicades i en el sector agroalimentari

Eusebi Jarauta Bragulat Árbol académico

  • español

    Los datos composicionales (compositional data, CODA) son datos vectoriales que describen las diferentes partes de un cierto total. Habitualmente, los datos composicionales se presentan como vectores de proporciones, porcentajes, concentraciones o frecuencias. El espacio al que pertenecen los datos composicionales se denomina símplex de n partes, que se define como el conjunto de vectores de n componentes estrictamente positivas y tales que la suma de estas componentes es constante. Dado que las proporciones se expresan como números reales, existe la tentación de interpretar, o incluso de analizar, los datos composicionales como si se tratara de datos reales multivariantes. Esta práctica puede conducir a paradojas o a malas interpretaciones tales como la correlación espuria y la paradoja de Simpson. En ciencias aplicadas e ingeniería, se estudian a menudo procesos dinámicos en los que las variables evolucionan con el tiempo. Un caso particular de interés especial es el estudio y la caracterización de procesos en los que las variables son composicionales y evolucionan con el tiempo (o el espacio). Estos procesos son muy habituales en ciencias agroalimentarias y biotecnológicas. En este tipo de procesos, los sistemas están representados por composiciones y se modelizan mediante funciones de valores en el símplex, definidas en intervalos de la recta real (tiempo, espacio). En este trabajo se presentan también los modelos diferenciales lineales composicionales y su utilidad en la descripción y en la estimación del comportamiento futuro de las variables del sistema. Finalmente, se comentan las conclusiones más importantes para que el trabajo con este tipo de datos se pueda aplicar en ingeniería agroalimentaria con garantías de fiabilidad y que se garanticen la formulación y la interpretación correctas de los resultados obtenidos.Palabras clave: datos composicionales, composiciones, símplex, geometría de Aitchison, ecuaciones diferenciales composicionales, curvas de crecimiento, sistema alimentario.

  • català

    Les dades composicionals (compositional data, CODA) són dades vectorials que descriuen les diferents parts d’un cert total. Habitualment, les dades composicionals es presenten com vectors de proporcions, percentatges, concentracions o freqüències. L’espai al qual pertanyen les dades composicionals s’anomena símplex de n parts, que es defineix com el conjunt de vectors de n components estrictament positives i tals que la suma d’aquestes components és constant. Atès que les proporcions s’expressen com nombres reals, hi ha la temptació d’interpretar, o fins i tot d’analitzar, les dades composicionals com si fossin dades reals multivariants. Aquesta pràctica pot conduir a paradoxes o a males interpretacions, com ara la correlació espúria i la paradoxa de Simpson. En ciències aplicades i enginyeria tot sovint s’estudien processos dinàmics en els quals les variables evolucionen amb el temps. Un cas particular d’interès especial és l’estudi i la caracterització de processos en els quals les variables són composicionals i evolucionen amb el temps (o l’espai). Aquests processos són molt habituals en ciències agroalimentàries i biotecnològiques. En aquest tipus de processos, els sistemes estan representats per composicions i es modelitzen mitjançant funcions de valors en el símplex, definides en intervals de la recta real (temps, espai). En aquest treball es presenten també els models diferencials lineals composicionals i la seva utilitat en la descripció i en l’estimació del comportament futur de les variables del sistema. Finalment, es comenten les conclusions més importants per tal que el treball amb aquest tipus de dades es pugui aplicar en enginyeria agroalimentària amb garanties de fiabilitat i que es garanteixin la formulació i la interpretació correctes dels resultats obtinguts.Paraules clau: dades composicionals, composicions, símplex, geometria d’Aitchison, equacions diferencials composicionals, corbes de creixement, sistema alimentari.

  • English

    Compositional data (CODA) are vectors that describe the different parts of a certain total. Usually, compositional data are presented as vectors of proportions, percentages, concentrations or frequencies. The space to which compositional data belong is called a “simplex of n parts”, which is defined as the set of vectors of n strictly positive components, such that the sum of these components is constant. Since the proportions are expressed as real numbers, there is a temptation to interpret or even analyse compositional data as if they were real multivariate data. This practice can lead to paradoxes or misinterpretations such as spurious correlation and Simpson’s paradox. In applied sciences and engineering, dynamic processes are often studied in which variables evolve over time. A special case of particular interest is the study and characterization of processes in which the variables are compositional and evolve over time (or space). These processes are very common in agri-food and biotechnological sciences. In this type of processes, the systems are represented by compositions and are modelled by value functions in the simplex, defined in intervals of the real line (time, space). This paper presents the compositional linear differential models and their usefulness in the description and estimation of the future behaviour of system variables. Finally, the most important conclusions are discussed so that work with this type of data can be applied in agri-food engineering with reliability guarantees and so that the correct formulation and interpretation of the results obtained is ensured.Keywords: compositional data, compositions, simplex, Aitchison geometry, compositional differential equations, growth curves, food system.


Fundación Dialnet

Mi Documat