Stylometry as a technique of linguistic-quantitative analysis: on the terminological use of style

Número

Downloads

Article abstract page views:  424  

DOI

https://doi.org/10.25267/Pragmalinguistica.2023.i31.15

Info

Papers
339-361
Published: 01-12-2023
PlumX

Authors

Abstract

Advances in computational and corpus linguistics have given a notable boost to stylometry as a technique of statistical analysis applied to textual corpora. Inserted in the methodological paradigm of digital humanities, stylometry is a sub-discipline of stylistics that allows the measurement of style following statistical techniques. Given that the bibliography on this subject is scarce in the Spanish-speaking world, we have not found an exact or consensual definition of style as a terminological usage linked to this field. This paper reviews the term from different perspectives, considering its relational character, and proposes a terminographic analysis in order to solve possible ambiguities; in parallel, a corpus specialised in stylometry has been elaborated to facilitate access to contextual and documentary information by means of semi-automated analysis.

Keywords


Downloads

Download data is not yet available.

How to Cite

Moyano Moreno, I. (2023). Stylometry as a technique of linguistic-quantitative analysis: on the terminological use of style. Pragmalingüística, (31), 339–361. https://doi.org/10.25267/Pragmalinguistica.2023.i31.15

References

AKHMANOVA, O. S. (ed.) (1970): The Principles and Methods of Linguostylistics: A Course of Lectures, Moskva: MGU.

ALARCÓN, R., BACH, C. y SIERRA, G. (2007): “Extracción de contextos definitorios en corpus especializados: Hacia la elaboración de una herramienta de ayuda terminográfica”, Revista española de lingüística, 37(1), pp. 215-246.

ALLEN, R. F. (1984): A style-statistical study of “Adolphe”. Preceded by indexes and a description of computer programming for language analysis, Genève/Paris: Slatkine/Champion.

ARNAUD, E. (1976) : “Quelques recherches de stylistique quantitative”, Cahiers du monde hispanique et luso-brésilien, 27, pp. 21-29.

AUGER, P. y ROUSSEAU, L. (1977) : Méthodologie de la recherche terminologique, Québec: Régie de la langue française.

BAILEY, R. W. y DOLEŽEL, L. (1968): An Annotated Bibliography of Statistical Stylistics, Berlin: De Gruyter.

BALDINGER, K. (1970): Teoría semántica. Hacia una semántica moderna, Madrid: Alcalá.

BALLY, C. (1909 [1970]): Traité de stylistique française, Genève: Georg & Cie S.A.

BOTO BRAVO, M. Á. (2017): “Mapa estilométrico de la narrativa de Eduardo Mendoza: Aproximación a un análisis estilístico computacional de textos literarios”, Epos: Revista de filología, 33, pp. 99-114. https://doi.org/10.5944/epos.33.2017.18281

CABRÉ, M. T. (1993): La terminología. Teoría, metodología, aplicaciones, Barcelona: Antártida/Empúries.

CARRIÓ PASTOR, M. (2020): “Conocer la lengua a través de los corpus: la herramienta Metool, retos para el análisis de los marcadores discursivos” Pragmalingüística, 28, pp. 255-274. https://doi.org/10.25267/Pragmalinguistica.2020.i28.13

CASAS GÓMEZ, M. (2006): “Modelos representativos de documentación terminográfica y su aplicación a la terminología lingüística”, Revista de lingüística y lenguas aplicadas, 1, pp. 25-36.

CASAS GÓMEZ, M. (2009): “Contenidos y tendencias de la semántica “tradicional” como etapa historiográfica”, García Martín, J. M. (dir.), Bastardín Candón, T. y Rivas Zancarrón, M. (eds.), Estudios de historiografía lingüística. Actas del VI Congreso Internacional de la Sociedad Española de Historiografía Lingüística en la senda de 1812: Las ideas y realidades lingüísticas en los siglos XVIII y XIX (Cádiz, del 6 al 9 de noviembre de 2007), Cádiz: Universidad de Cádiz, pp. 113-150.

CASAS GÓMEZ, M. (2015): “Semántica léxica, terminología y terminografía: a propósito de los usos terminológicos relacionados con los contenidos y perspectivas actuales de la semántica léxica”, Santana Marrero J., León-Castro Gómez M., Zerva A. (coords.), La variación en el español actual: estudios dedicados al profesor Pedro Carbonero, Sevilla: Universidad de Sevilla, pp. 91-110.

CASAS GÓMEZ, M. (2020): DOCUTERM: Modelo de documentación de usos terminológicos, Patente registrada con número 202099908175522, número de expediente: CA-00256-2020 y número de asiento registral 04/2020/4177.

CASAS GÓMEZ, M. (2021): “La semántica de Kurt Baldinger”, Escavy Zamora, R., Hernández Sánchez, E., Sánchez Manzanares, M. C. (eds.), La semántica de Kurt Baldinger en la perspectiva de la lingüística actual, Murcia: Universidad de Murcia, pp. 59-105.

CASAS GÓMEZ, M. (2022): “DOCUTERM: Modelo de documentación de usos terminológicos”, Revista de Lingüística y Lenguas Aplicadas, 17, pp. 11-27. https://doi.org/10.4995/rlyla.2022.16249

COULTHARD, M., JOHNSON, A., y WRIGHT, D. (2016): An introduction to forensic linguistics: Language in evidence, London/New York: Routledge.

CRESPO MIGUEL, M. (2020): “Lingüística digital: revisión de su estado actual y retos en el Instituto Universitario de Investigación en Lingüística Aplicada de la Universidad de Cádiz”, Pragmalingüística, 28, pp. 148-165. https://doi.org/10.25267/Pragmalinguistica.2020.i28.08

CRESPO MIGUEL, M. (2021): “Las humanidades digitales en el contexto de la lingüística forense: aplicación a sentencias del Consejo General del Poder Judicial”, Derecho y lingüística: entre la concepción teórica y los ciudadanos, 92, pp. 55-70.

CRYSTAL, D. (1997): The Cambridge Encyclopedia of Language, Cambridge: Cambridge University Press.

DAELEMANS, W. (2013): “Explanation in computational stylometry”, Gelbukh, A. (ed.), International Conference on Intelligent Text Processing and Computational Linguistics, Berlin/Heidelberg: Springer, pp. 451-462.

https://doi.org/10.1007/978-3-642-37256-8_37

DÍAZ NEGRILLO, A., y DOMÍNGUEZ FERNÁNDEZ, J. (2010): “Corpus terminológicos”, Roldán Vendrell, M. (ed.), Bases para la terminología multilingüe del aceite de oliva, olive oil, Granada: Comares, pp. 37-50.

DUBUC, R. (1999): Manual práctico de terminología. Versión traducida de Ileana Cabrera. 3. ed. corregida y actualizada, Providencia: Unión Latina, RiL editores.

DUGAST, D. (1980): La statistique lexicale, Genève: Slatkine.

EDER, M. y KESTEMONT, M. (2016): “Stylometry with R: A Package for Computational Text Analysis”, The R Journal, 8(1), pp. 107-121. http://dx.doi.org/10.32614/RJ-2016-007

FERNÁNDEZ TRILLO, J. J. (2015): La problemática autoría de Carlos Castaneda: Un estudio estilométrico de candidato único. Tesis Doctoral. Madrid: Universidad Autónoma de Madrid.

FUSTER MÁRQUEZ, M. (2022): “Phraseology and Style in Margaret Jull Costa’s English Translation of Marías’ Corazón Tan Blanco (1992)”, Pragmalingüística, 30, pp. 143-162. https://doi.org/10.25267/Pragmalinguistica.2022.i30.07

GRIEVE, J. (2007): “Quantitative Authorship Attribution: An Evaluation of Techniques”, Literary and Linguistic Computing, 22(3), pp. 251-270. https://doi.org/10.1093/llc/fqm020

HERNÁNDEZ LORENZO, L. (2022): “Stylistic Change in Early Modern Spanish Poetry Through Network Analysis (with an Especial Focus on Fernando de Herrera’s Role)”, Neophilologus, 106, pp. 397-417. https://doi.org/10.1007/s11061-021-09717-2

HOLMES, D. I. (1998): “The Evolution of Stylometry in Humanities Scholarship”, Literary and linguistic computing, 13(3), pp. 111-117. https://doi.org/10.1093/llc/13.3.111

HORTON, T. B. (1987): The Effectiveness of the Stylometry of Function words in Discriminating between Shakespeare and Fletcher. Tesis Doctoral. Edimburgh: University of Edimburgh.

JEFFRIES, L., y MCINTYRE, D. (2010): Stylistics, Cambridge: Cambridge University Press.

JOCKERS, M. L. (2013): Macroanalysis: Digital methods and literary history, Urbana: University of Illinois Press.

KOCK, J., de GEENS, D. (col.), DELBECQUE, N. (col.), GÓMEZ MOLINA, C. (col.) y KEYSER, R. (col.) (1983): Elementos para una estilística computacional, Madrid: Coloquio.

LOZANO ZAHONERO, M. (2020): “Una nueva visión de la supuesta influencia de Madame Bovary en La Regenta a través de la estilometría y el análisis de sentimientos basados en lenguaje R”, Orillas: rivista d’ispanistica, 9, pp. 573-607.

LUTOSŁAWSKI, W. (1898): “Principes de stylométrie appliqués à la chronologie des œuvres de Platon”, Revue des études grecques, 11(41), pp. 61-81.

MÉNARD, N. (1983): Mesure de la richesse lexicale: théorie et verifications experimentales, Genève/Paris: Slat-kine/Champion.

MORETTI, F. (2000): “Conjectures on world literature”, New left review, 1, p. 54.

MORETTI, F. (2013): Distant Reading, London/New York: Verso Books.

NEAL, T., SUNDARARAJAN, K., FATIMA, A., YAN, Y., XIANG, Y. y WOODARD, D. (2017): “Surveying stylometry techniques and applications”, ACM Computing Surveys (CSuR), 50(6), pp. 1-36. https://doi.org/10.1145/3132039

OLSSON, J. (2008): Forensic Linguistics: Second Edition, New York: Continuum International Publishing Group.

ORGOŇOVÁ, O. (2019): “Aspects of contemporary trends in linguostylistics and in Slovak linguostylistics”, SKASE Journal of Theoretical Linguistics, 16(3), pp. 80-89.

PÉREZ HERNÁNDEZ, M. C. (2002): “Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento”, Estudios de lingüística del español, 18. Disponible en: http://elies.rediris.es/elies18/index.html (Fecha de consulta: 11/09/2022).

QUERALT, S. (2020): “El uso de recursos tecnológicos en lingüística forense”, Pragmalingüística, 28, pp. 212-237. https://doi.org/10.25267/Pragmalinguistica.2020.i28.11

RAMÍREZ SALADO, M. (2019): Terminología y lingüística forense: usos terminológicos relacionados con los ámbitos de actuación de la lingüística forense y su interfaz con otras disciplinas. Tesis Doctoral. Universidad de Cádiz.

RIFFATERRE, M. (1971): Essais de stylistique structurale, Paris: Flammarion.

SANTAMARÍA PÉREZ, I. (2009): La terminología: definición, funciones y aplicaciones, Alicante: Repositorio de la Universidad de Alicante. Disponible en: http://rua.ua.es/dspace/bitstream/10045/12770/8/La_terminolog%C3%ADa.pdf (Fecha de consulta: 11/09/2022).

SAUSSURE, F. de (1916 [1922]): Cours de Linguistique Générale. Publié par Ch. Bally et A. Sechehaye avec la collaboration de A. Riedlinger, 2ª ed., Paris: Payot.

SHORT, M. (2018): Exploring the language of poems, plays and prose, London/New York: Routledge.

STAMATATOS, E. (2009): “A survey of modern authorship attribution methods”, Journal of the American Society for Information Science and Technology, 60(3), pp. 538-556. https://doi.org/10.1002/asi.21001

ULLMANN, S. (1964): Language and style, Oxford: Basil Blackwell.

ULLMANN, S. (1973): Meaning and style. Collected Papers, Oxford: Basil Blackwell.

VEGA GARCÍA-LUENGOS, G. (2021): “Las comedias de Lope de Vega: confirmaciones de autoría y nuevas atribuciones desde la estilometría (I)”, Talía. Revista de estudios teatrales, 3, pp. 91-108. https://doi.org/10.5209/tret.74625

WALES, K. (2014a): A dictionary of stylistics, London: Routledge.

WALES, K. (2014b): “The stylistic toolkit: Methods and subdisciplines”, Stockwell, P. y Whiteley, S. (eds.), The Cambridge handbook of stylistics, Cambridge: Cambridge University Press, pp. 32-45.

WEIGER, J. G. (1980): “On the Application of Stylostatistics to the Analysis of the Comedia”, Bulletin of the Comediantes, 32(1), pp. 63-73.