Ir al contenido

Documat


Tractament de corpus textuals lematitzats i estudi comparatiu del llenguatge cientific amb la prosa estandard

  • Autores: Anna Puig Montada
  • Directores de la Tesis: José Andrés Martín Rioja (dir. tes.) Árbol académico
  • Lectura: En la Universitat Politècnica de Catalunya (UPC) ( España ) en 1995
  • Idioma: catalán
  • Tribunal Calificador de la Tesis: Ramón Cerdá Massó (presid.) Árbol académico, Toni Badia Cardús (secret.) Árbol académico, Ton Sales Porta (voc.) Árbol académico, José Francisco Simón Granda (voc.) Árbol académico, Joaquim Rafel i Fontanals (voc.) Árbol académico
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • EN ESTA TESIS SE REALIZA UN TRATAMIENTO DE UN CORPUS DE TEXTOS CATALANES DE UN TOTAL DE 30885 LEMAS CLASIFICADOS POR SUS CATEGORIAS Y QUE LES CORRESPONDEN 777485 OCURRENCIAS, EL CORPUS PROCEDE DE LIBROS DE CUATRO MATERIAS, ESTAS SON: LOGICA, MATEMATICAS, FISICA Y QUIMICA Y PROSA ESTANDAR. DICHO CORPUS ENTRADO POR ESCANER AL ORDENADOR HA SIDO ESTUDIADO POR METODOS ESTADISTICOS Y SE HAN REALIZADO LAS COMPARACIONES ENTRE LAS CUATRO MATERIAS. SE HA CALCULADO LA ENTROPIA SEGUN SHANNON DE CADA MATERIA MEDIANTE EL USO DE PROGRAMAS REALIZADOS EN PASCAL. SE HA CALCULADO LA MEDIA Y LA DESVIACION ESTANDAR. EN UNA FASE POSTERIOR SE HA APLICADO LA TEORIA DE PROXIMIDADES A LOS CUATRO TIPOS DE CORPUS, CALCULANDO LA DIMENSION FRACTAL PARA PODER CARACTERIZAR CADA TIPO DE LENGUAJE. FINALMENTE SE RELACIONAN LA ENTROPIA JUNTO CON LA TEORIA DE PROXIMIDADES PARA DEDUCIR EL PERFIL DE CADA TIPO DE LENGUAJE, TANTO GLOBALMENTE COMO PARA EL CASO DE LOS SUBSTANTIVOS.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno