top of page

SOBRE A RST
     A RST é uma teoria que tem por objetivo estudar a coerência dos textos, em especial no que diz respeito às relações que se estabelecem entre as partes do texto, tanto na macro quanto na microestrutura (MANN & THOMPSON, 1988). A RST tem sido usada tanto na Linguística Descritiva quanto na Linguística Computacional.
     No primeiro caso, é uma ferramenta de análise da Linguística de Texto, apresentando grande utilidade na descrição da superestrutura de diversos gêneros textuais, como pode ser observado nos trabalhos a respeito do português brasileiro de Giering (2009), Decat (2010), Antonio (2004). Além disso, tem grande destaque na Linguística Funcional no que tange ao estudo da combinação de orações, descrevendo relações que se estabelecem entre as orações na microestrutura textual (MATTHIESSEN & THOMPSON, 1988).
     Uma questão que merece destaque nas investigações a respeito da RST é a descrição dos meios pelos quais as relações se estabelecem. De acordo com a RST, as relações são de sentido, e não de forma (MANN & THOMPSON, 1988), ou seja, as relações são estabelecidas e interpretadas independentemente de serem marcadas por conectivos. Assim, outras formas de marcação das relações devem ser investigadas, como, por exemplo, marcas morfológicas, sintáticas, gráficas, de entonação (no caso da língua falada), de referência textual, do gênero textual etc (TABOADA, 2006).
     Um aspecto muito importante da RST diz respeito ao fato de a teoria poder ser aplicada a qualquer língua e poder ser utilizada para descrever a maioria dos textos, de acordo com Marcu (2000). Prova disso é que diferentes línguas já foram anotadas utilizando-se a RST: em inglês, Carlson et al. (2002) anotaram manualmente textos jornalísticos. Também em inglês, Taboada e Renkema (2011) anotaram, além de textos de jornalísticos, anúncios, cartas, artigos de revistas, artigos científicos, críticas de livros, artigos de opinião. Em alemão, Stede (2004) também anotou textos jornalísticos. Em português, Pardo e Seno (2005) anotaram textos sobre informática. Em espanhol, da Cunha et al. (2011) anotaram textos científicos de diversas áreas. Por fim, em basco, Iruskieta et al. (2013) anotaram resumos de textos científicos.
     Existem diversas ferramentas que facilitam a tarefa de anotação e de revisão. Por exemplo, a ferramenta RSTTool é muito útil para a notação da estrutura retórica (O’DONNELL, 2000), a RSTeval pode ser utilizada para a avaliação automática de estruturas retóricas por pares em uma mesma língua (MAZEIRO & PARDO, 2009) (implementado para inglês, português, espanhol e basco) e a RhetDatabase é uma base de dados em que se podem anotar as marcas que sinalizam relações retóricas (PARDO, 2005) para estudo linguístico e para uso computacional.
     No que diz respeito às tarefas automáticas, podemos ressaltar os analisadores (parsers) automáticos para o inglês (MARCU, 2000; TOFILOSKI & BROOKE ET AL., 2009), para o português brasileiro (PARDO, 2006), para o espanhol (DA CUNHA & SAN JUAN ET AL., 2012) e para o basco (IRUSKIETA & DÍAZ-DE-ILARRAZA ET AL., 2011).
     No âmbito da RST, desenvolveram-se diversos programas para realização de análise discursiva automática: por exemplo, há analisadores para o japonês (SUMITA & ONO ET AL., 1992), para o inglês (CORSTON-OLIVER, 1998; MARCU, 2000; HANNEFORTH & HEINTZE ET AL., 2003) e para o português brasileiro (PARDO & NUNES ET AL., 2004).
Embora existam alguns estudos da RST sobre corpora paralelos (ABELEN, REDEKER ET AL., 1993; CUI, 1986; MARCU, CARLSON ET AL., 2000; GUY, 2001; TABOADA, 2004), para citar alguns, como as diferenças da estrutura retórica do discurso podem ser implementadas em regras de tradução que possam ser implementadas em tarefas de tradução automática (KORZEN & GYLLING, 2012) ou como afetam as estratégias de tradução nas estruturas retóricas (DA CUNHA & IRUSKIETA, 2010), não há um corpus paralelo anotado em nível discursivo que possa servir de referência e de discussão para a comunidade científica e para possível exploração computacional em tarefas de tradução automática.
     Um bom resumo do que tem sido feito sobre e com a RST está disponível em Taboada e Mann (2006) e há muitas informações a respeito da teoria em http://www.sfu.ca/rst.

 

REFERÊNCIAS
ABELEN, E.; REDEKER, G. and THOMPSON, S.A. 1993. The rhetorical structure of US-American and Dutch fund-raising letters. Text 13(3), 323-350.
ANTONIO, J.D. Estrutura retórica e articulação de orações em narrativas orais e em narrativas escritas do português. Araraquara, 2004. Tese (Doutorado em Linguística e Lígua Portuguesa). Faculdade de Ciências e Letras/ Unesp/ Araraquara.
CARLSON, L., OKUROWSKI, M.E. and MARCU, D., 2002. RST Discourse Treebank, LDC2002T07 [Corpus]. Philadelphia: PA: Linguistic Data Consortium.
CORSTON-OLIVER, S., 1998. Identifying the linguistic correlates of rhetorical relations, Proceedings of the ACL Workshop on Discourse Relations and Discourse Markers 1998, pp. 8–14.
CUI, S. 1986. A comparison of English and Chinese expository rhetorical structures. University of California (USA): UCLA dissertation.
DA CUNHA, I., SAN JUAN, E., TORRES-MORENO, J.M., LLOBERESE, M. and CASTELLÓNE, I., 2012. DiSeg 1.0: The first system for Spanish discourse segmentation. Expert Systems with Applications, 39(2), pp. 1671-1678.
DA CUNHA, I. and IRUSKIETA, M., 2010. Comparing rhetorical structures in different languages: The influence of translation strategies. Discourse Studies, 12(5), pp. 563-598.
DA CUNHA, I., TORRES-MORENO, J. and SIERRA, G., 2011. On the Development of the RST Spanish Treebank, 5th Linguistic Annotation Workshop (LAW V '11), 23 June 2011, Association for Computational Linguistics, pp. 1-10.
DECAT, M. B. N. Estrutura retórica e articulação de orações em gêneros textuais diversos: uma abordagem funcionalista. In: MARINHO, Janice Helena Chaves; SARAIVA, Maria Elizabeth Fonseca. (Org.). Estudos da língua em uso: da gramática ao texto. Belo Horizonte: Editora UFMG, 2010, v. , p. 231-262.
GIERING, M. E. A organização retórica de artigos de divulgação científica midiática e a organização sequencial do texto. Desenredo (PPGL/UPF), v. 5, p. 78-99, 2009.
HANNEFORTH, T., HEINTZE, S. and STEDE, M., 2003. Rhetorical parsing with underspecification and forests, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: companion volume of the Proceedings of HLT-NAACL 2003--short papers-Volume 2 2003, Association for Computational Linguistics, pp. 31-33.

IRUSKIETA, M., DÍAZ DE ILARRAZA, A. and LERSUNDI, M., 2013. Establishing criteria for RST-based discourse segmentation and annotation for texts in Basque. Corpus Linguistics and Linguistic Theory.
IRUSKIETA, M., DÍAZ-DE-ILARRAZA, A. and LERSUNDI, M., 2011. Bases para la implementación de un segmentador discursivo para el euskera, 8th Brazilian Symposium in Information and Human Language Technology (STIL 2011), OCTOBER 2011 2011.
KORZEN, I. and GYLLING, M., 2012. Text structure in a contrastive and translational perspective: on information density and clause linkage in italian and danish. Translation: Computation, Corpora, Cognition, 2(1), pp. 23-46.
MANN, W.C. and THOMPSON, S.A., 1988. Rhetorical Structure Theory: Toward a functional theory of text organization. Text-Interdisciplinary Journal for the Study of Discourse, 8(3), pp. 243-281.
MARCU, D., 2000. The theory and practice of discourse parsing and summarization. Cambridge: The MIT press.
MARCU, D.; CARLSON, L. and WATANABE, M. 2000. The automatic translation of discourse structures. Paper presented at the 1st North American chapter of the Association for Computational Linguistics conference, Seattle (USA), April 30-May 4.
MATTHIESSEN, C.; THOMPSON, S. The structure of discourse and ‘subordination’. In: HAIMAN, J. e THOMPSON, S. (Eds.) Clause Combining in Grammar and Discourse. Amsterdam/Philadelphia: J. Benjamins, 1988. p. 275-329.
MAZEIRO, E.G. and PARDO, T.A.S., 2009. Metodologia de avaliação automática de estruturas retóricas [Methodology for automatic evaluation of rhetorical structures], 7th Brazilian Symposium in Information and Human Language Technology (STIL), 8-11 September 2009.
O'DONNELL, M., 2000. RSTTool 2.4: a markup tool for Rhetorical Structure Theory, First International Conference on Natural Language Generation INLG '00, June12-16 2000, ACL, pp. 253-256.
PARDO, T.A.S., 2006. SENTER: um segmentador sentencial automático para o português do Brasil.
PARDO, T.A.S., 2005. Métodos para análise discursiva automática [Methods for automatic discourse analysis], Instituto de Ciências Matemáticas e de Computação.
PARDO, T.A.S., NUNES, M.G.V. and RINO, L.H.M., 2004. DiZer: An Automatic Discourse Analyzer for Brazilian Portuguese. Advances in Artificial Intelligence–SBIA 2004, , pp. 224-234.
PARDO, T.A.S. and SENO, E.R.M., 2005. Rhetalho: um corpus de referência anotado retoricamente [Rhetalho: a rhetorically annotated reference corpus], Anais do V Encontro de Corpora, 24-25 November 2005.
GUY, R. 2001. Rhetorical styles and newstexts: A contrastive analysis of rhetorical relations in Chinese and Australian news-journal text. ASAA E-Journal of Asian Linguistics and Language-teaching 1(1), 1-22.
SCOTT, D.R., DELIN, J. & HARTLEY, A.F. 1998. Identifying congruent pragmatic relations in procedural texts. Languages in Contrast 1(1), 45-82.
STEDE, M., 2004. The Potsdam commentary corpus, 2004 ACL Workshop on Discourse Annotation, 25-26 July 2004, Association for Computational Linguistics, pp. 96-102.
SUMITA, K., ONO, K., CHINO, T. and UKITA, T., 1992. A discourse structure analyzer for Japanese text, 1992, ICOT, pp. 1133-1140.
TABOADA, M. 2004. Building coherence and cohesion: Task-oriented dialogue in English and Spanish. Amsterdam and Philadelphia: John Benjamins.
TABOADA, M. and MANN, W.C., 2006. Applications of Rhetorical Structure Theory. Discourse Studies, 8(4), pp. 567-588.
TABOADA, M. 2006. Discourse Markers as Signals (or Not) of Rhetorical Relations. Journal of Pragmatics, 38(4):567-592.
TABOADA, M. and  RENKEMA, J., 2011-last update, Discourse Relations Reference Corpus2012].
TOFILOSKI, M., BROOKE, J. and TABOADA, M., 2009. A syntactic and lexical-based discourse segmenter, 47th Annual Meeting of the Association for Computational Linguistics, 2-7 August 2009, ACL, pp. 77-80.

ABOUT RST
     RST is a theory which aims at investigating text coherence, specially regarding relations held between parts of text, both in macro and microstructure (MANN and THOMPSON, 1988). RST has been used in Descriptive Linguistics and in Computational Linguistics.
     In Linguistics, RST is a framework for the analysis of texts. It is very useful for the description of the superstructure of diverse text genres, as pointed in researches in Brazilian Portuguese by Giering (2009), Decat (2010), Antonio (2004). Besides that, RST is a prominent theory in Functional Linguistics regarding the investigation of clause combining, describing the relations which are held between clauses in microstructure (MATTHIESSEN and THOMPSON, 1988).
     A relevant research point in RST is the investigation of the linguistic means used by speakers to signal relations. According to RST, these relations are of meaning, and not formal (MANN and THOMPSON, 1988). This means that relations can be held and interpreted without being formally marked by connectives, for example. Thus, other linguistic means of signaling relations must be investigated in Phonology (Intonation in spoken language, for example), Morphology, Syntax, text genre etc (TABOADA, 2006).
     A relevant aspect of RST is the fact that the theory can be applied to any language and that it can be used to describe almost all text genres, according to Marcu (2000). Many languages have already been annotated using RST: Carlson et al. (2002) annotated manually newspaper articles in English. Taboada and Renkema (2011) annotated, besides newspaper articles, advertisements, letters, magazine articles, scientific papers, books reviews and opinative articles. Stede (2004) annotated newspaper articles in German. Pardo and Seno (2005) annotated texts about computing in Brazilian Portuguese. Da Cunha et al. (2011) annotated scientific papers of diverse areas in Spanish. Iruskieta et al. (2013) annotated abstracts of scientific texts in Basque.
     There are many tools which make the annotation and revision tasks easier. It is the case of RSTTool, which is very useful for the annotation of rhetorical structure (O’DONNEL, 2000); RSTeval can be used for the automatic evaluation of rhetorical structures of pairs in the same language (MAZEIRO and PARDO, 2009) (implemented for English, Portuguese, Spanish and Basque); and RhetDatabase is a database in which the cues that signal rhetorical relations can be annotated (PARDO, 2005) both for linguistic and computational use.
Tools for performing automatic tasks have been designed using RST: automatic parsers for English (MARCU, 2000; TOFILOSKI and BROOKE ET AL., 2009), for Brazilian Portuguese (PARDO, 2006) and for Spanish (DA CUNHA and SAN JUAN ET AL., 2012) and for Basque (IRUSKIETA and DÍAZ-DE-ILARRAZA ET AL., 2011).
     Within RST framework, many softwares for automatic discourse analysis have been designed: for example, there are analyzers for Japanese (SUMITA and ONO ET AL., 1992), for English (CORSTON-OLIVER, 1998; MARCU, 2000; HANNEFORTH and HEINTZE ET AL., 2003) and for Brazilian Portuguese (PARDO and NUNES ET AL., 2004).
     Although there are RST investigations about parallel corpora (ABELEN, REDEKER ET AL., 1993; CUI, 1986; MARCU, CARLOS ET AL., 2000; GUY, 2001; TABOADA, 2004, among others), as differences in rhetorical structure can be implemented in translation rules which can be implemented in automatic translation tasks (KORZEN and GYLLING, 2012) or how they affect translation strategies in rhetorical structures (DA CUNHA and IRUSKIETA, 2010), there is no parallel corpus annotated in discourse level which can be used as reference for scientific community and for eventual computational exploitation in automatic translation tasks.
     A good summary of what has been done about and with RST is available at Taboada and Mann (2006) and there is plenty of information about the theory at http://www.sfu.ca/rst.

 

REFERENCES
ABELEN, E.; REDEKER, G. and THOMPSON, S.A. 1993.The rhetorical structure of US-American and Dutch fund-raising letters.Text 13(3), 323-350.
ANTONIO, J.D. Estrutura retórica e articulação de oraçõesem narrativas orais e em narrativas escritas do português. Araraquara, 2004. Tese (DoutoradoemLinguística e Lígua Portuguesa). Faculdade de Ciências e Letras/ Unesp/ Araraquara.
CARLSON, L., OKUROWSKI, M.E. and MARCU, D., 2002.RST Discourse Treebank, LDC2002T07 [Corpus].Philadelphia: PA: Linguistic Data Consortium.
CORSTON-OLIVER, S., 1998. Identifying the linguistic correlates of rhetorical relations, Proceedings of the ACL Workshop on Discourse Relations and Discourse Markers 1998, pp. 8–14.
CUI, S. 1986. A comparison of English and Chinese expository rhetorical structures. University of California (USA): UCLA dissertation.
DA CUNHA, I., SAN JUAN, E., TORRES-MORENO, J.M., LLOBERESE, M. and CASTELLÓNE, I., 2012. DiSeg 1.0: The first system for Spanish discourse segmentation. Expert Systems with Applications, 39(2), pp. 1671-1678.
DA CUNHA, I. and IRUSKIETA, M., 2010. Comparing rhetorical structures in different languages: The influence of translation strategies. DiscourseStudies, 12(5), pp. 563-598.
DA CUNHA, I., TORRES-MORENO, J. and SIERRA, G., 2011. On the Development of the RST Spanish Treebank, 5th Linguistic Annotation Workshop (LAW V '11), 23 June 2011, Association for Computational Linguistics, pp. 1-10.
DECAT, M. B. N. Estrutura retórica e articulação de orações em gêneros textuais diversos: uma abordagem funcionalista. In: MARINHO, Janice Helena Chaves; SARAIVA, Maria Elizabeth Fonseca. (Org.). Estudos da língua em uso: da gramática ao texto. Belo Horizonte: Editora UFMG, 2010, p. 231-262.
GIERING, M. E.A organização retórica de artigos de divulgação científica midiática e a organização sequencial do texto. Desenredo (PPGL/UPF), v. 5, p. 78-99, 2009.
HANNEFORTH, T., HEINTZE, S. and STEDE, M., 2003. Rhetorical parsing with underspecification and forests, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: companion volume of the Proceedings of HLT-NAACL 2003--short papers-Volume 2 2003, Association for Computational Linguistics, pp. 31-33.

IRUSKIETA, M., DÍAZ DE ILARRAZA, A. and LERSUNDI, M., 2013. Establishing criteria for RST-based discourse segmentation and annotation for texts in Basque. Corpus Linguistics and Linguistic Theory.
IRUSKIETA, M., DÍAZ-DE-ILARRAZA, A. and LERSUNDI, M., 2011. Bases para la implementación de unsegmentadordiscursivopara el euskera, 8th Brazilian Symposium in Information and Human Language Technology (STIL 2011), OCTOBER 2011 2011.
KORZEN, I. and GYLLING, M., 2012. Text structure in a contrastive and translational perspective: on information density and clause linkage in italian and danish. Translation: Computation, Corpora, Cognition, 2(1), pp. 23-46.
MANN, W.C. and THOMPSON, S.A., 1988. Rhetorical Structure Theory: Toward a functional theory of text organization. Text-Interdisciplinary Journal for the Study of Discourse, 8(3), pp. 243-281.
MARCU, D., 2000. The theory and practice of discourse parsing and summarization.Cambridge: The MIT press.
MARCU, D.; CARLSON, L.and WATANABE, M. 2000.The automatic translation of discourse structures. Paper presented at the 1st North American chapter of the Association for Computational Linguistics conference, Seattle (USA), April 30-May 4.
MATTHIESSEN, C.; THOMPSON, S.The structure of discourse and ‘subordination’. In: HAIMAN, J. e THOMPSON, S. (Eds.) Clause Combining in Grammar and Discourse. Amsterdam/Philadelphia: J. Benjamins, 1988. p. 275-329.
MAZEIRO, E.G. and PARDO, T.A.S., 2009.Metodologia de avaliaçãoautomática de estruturasretóricas [Methodology for automatic evaluation of rhetorical structures], 7th Brazilian Symposium in Information and Human Language Technology (STIL), 8-11 September 2009.
O'DONNELL, M., 2000. RSTTool 2.4: a markup tool for Rhetorical Structure Theory, First International Conference on Natural Language Generation INLG '00, June12-16 2000, ACL, pp. 253-256.
PARDO, T.A.S., 2006. SENTER: umsegmentadorsentencial automático para o português do Brasil.
PARDO, T.A.S., 2005. Métodos para análise discursiva automática [Methodsforautomaticdiscourseanalysis], Instituto de Ciências Matemáticas e de Computação.
PARDO, T.A.S., NUNES, M.G.V. and RINO, L.H.M., 2004. DiZer: An Automatic Discourse Analyzer for Brazilian Portuguese. Advances in Artificial Intelligence–SBIA 2004, , pp. 224-234.
PARDO, T.A.S. and SENO, E.R.M., 2005. Rhetalho: um corpus de referência anotado retoricamente [Rhetalho: a rhetoricallyannotatedreference corpus], Anais do V Encontro de Corpora, 24-25 November 2005.
GUY, R. 2001. Rhetorical styles and newstexts: A contrastive analysis of rhetorical relations in Chinese and Australian news-journal text. ASAA E-Journal of Asian Linguistics and Language-teaching 1(1), 1-22.
SCOTT, D.R., DELIN, J.&HARTLEY, A.F. 1998. Identifying congruent pragmatic relations in procedural texts. Languages in Contrast 1(1), 45-82.
STEDE, M., 2004. The Potsdam commentary corpus, 2004 ACL Workshop on Discourse Annotation, 25-26 July 2004, Association for Computational Linguistics, pp. 96-102.
SUMITA, K., ONO, K., CHINO, T. and UKITA, T., 1992.A discourse structure analyzer for Japanese text, 1992, ICOT, pp. 1133-1140.
TABOADA, M. 2004. Building coherence and cohesion: Task-oriented dialogue in English and Spanish. Amsterdam and Philadelphia: John Benjamins.
TABOADA, M. and MANN, W.C., 2006. Applications of Rhetorical Structure Theory.Discourse Studies, 8(4), pp. 567-588.
TABOADA, M. 2006. Discourse Markers as Signals (or Not) of Rhetorical Relations. Journal of Pragmatics,38(4):567-592.
TABOADA, M. and  RENKEMA, J., 2011-last update, Discourse Relations Reference Corpus2012].
TOFILOSKI, M., BROOKE, J. and TABOADA, M., 2009.A syntactic and lexical-based discourse segmenter, 47th Annual Meeting of the Association for Computational Linguistics, 2-7 August 2009, ACL, pp. 77-80.

SOBRE LA RST
     La RST es una teoría que tiene por objetivo estudiar la coherencia textual, en particular sobre las partes del texto, tanto en la micro-estructura como en la macro-estructura (MANN y THOMPSON, 1988). La RST se ha tenido en cuenta tanto en la Lingüística Descriptiva como en la Lingüística Computacional.
     En cuanto a la Lingüística Descriptiva, que es una herramienta de análisis de la Lingüística Textual, se han presentado trabajos sobre la superestructura de diversos géneros textuales describiendo el portugués de Brasil (GIERING, 2009; DECAT, 2010; ANTONIO, 2004). Además de eso, la RST tiene un gran protagonismo en el estudio de la Lingüística Funcional en relación al estudio de la combinación de oraciones, que describe las relaciones que se establecen entre las oraciones en la microestructura textual (MATTHIESSEN y THOMPSON, 1988).
     Un tema que merece atención en las investigaciones relativas a la RST es la descripción de los medios por los que se establecen las relaciones. De acuerdo con la RST, las relaciones son de sentido y no de forma (MANN y THOMPSON, 1988), a saber, las relaciones se establecen y se interpretan de forma independiente de si hay marcadores de discurso que las señalen. Por lo tanto, otros medios de identificación de las relaciones deben ser investigados, por ejemplo, las marcas morfológicas, sintácticas, gráficas, de entonación (en el caso del lenguaje hablado), dependiendo del tipo de texto o de genero, etc (TABOADA, 2006).
     Un aspecto muy importante de la RST se relaciona con el hecho de que la teoría puede ser aplicada a cualquier idioma y se pueden utilizar para describir la mayoría de los textos, de acuerdo con Marcu (2000). Prueba de ello es que las lenguas diferentes han sido grabados con la RST: Inglés, Carlson et al. (2002) observó textos periodísticos manualmente. También en Inglés, Taboada y Renkema (2011) señaló, y textos periodísticos, anuncios, cartas, artículos, revistas, artículos de periódicos, reseñas de libros, artículos de opinión. En alemán, Stede (2004) también observó textos periodísticos. En portugués, Pardo y Seno (2005) tomó nota de los textos sobre computación. En español, da Cunha et al. (2001) señaló varias áreas de los textos científicos. Por último, en euskera, Iruskieta et al. (2013) señaló resúmenes de textos científicos.
     Una afirmación importante que se hace desde la RST es que es de lenguaje independiente y puede valer según Marcu (2000) para describir la mayoría de textos. Prueba de esto es que basándose en esta teoría se han etiquetado textos de varios géneros en diferentes lenguas que están a disposición de la comunidad científica: en inglés tanto Carlson et al. (2002) que han etiquetado manualmente textos periodísticos, como Taboada y Renkema (2011) que lo han hecho además de textos periodísticos, anuncios, cartas, artículos de revistas, artículos científicos, críticas de libros, artículos de opinión; en alemán Stede (2004) también anotó textos periodísticos; en portugués de Brasil Pardo y Seno (2005) anotaron textos sobre informática; en español da Cunha et al. (2011) anotaron textos científicos de distintos ámbitos; y, por último, en euskera Iruskieta et al. (Forthcoming) anotaron resúmenes de textos científicos.
     Para realizar dichas anotaciones existen diferentes herramientas que facilitan las tareas de anotación o de revisión: por ejemplo, la RSTTool es muy útil para la anotación de la estructura retórica (O'DONNELL, 2000); la RSTeval puede ser utilizado para la evaluación automática de estructuras retóricas por pares en una misma lengua, implementada para el inglés, portugués, español y euskera (MAZEIRO y PARDO, 2009); y la RhetDatabase que es una base de datos en la que se pueden anotar las marcas que señalan relaciones retóricas, tanto para su estudio lingüístico como para su uso computacional (PARDO 2005).
     En cuanto a las tareas automáticas, podemos subrayar los segmentadores  automáticos para el inglés (MARCU, 2000, TOFILOSKI ET AL., 2009), para el Portugués de Brasil (PARDO 2006), para el español (DA CUNHA ET AL., 2012) y para el euskera (IRUSKIETA ET AL., 2011)
     Dentro de la RST, se han diseñado distintos programas para realizar el análisis discursivo automático: por ejemplo, hay analizadores para el japonés (SUMITA ET AL., 1992), para el inglés (CORSTON-OLIVER, 1998; MARCU, 2000; HANNEFORTH et al., 2003); y para el portugués de Brasil (PARDO ET AL., 2004)
     Aunque hay algunos estudios en la RST sobre corpus paralelos (ABELEN ET AL., 1993; CUI, 1986; MARCU ET AL., 2000; GUY, 2001; TABOADA, 2004) por citar algunos, como las diferencias de la estructura del discurso pueden ser implementadas en reglas de traducción que puedan ser implementadas en tareas de traducción automática (KORZEN y GYLLING 2012) o como afectan las estrategias de traducción en las estructuras retóricas (DA CUNHA e IRUSKIETA, 2010), no hay un corpus paralelo anotado a nivel discursivo que pueda servir de referencia y de discusión para la comunidad científica.

     Un buen resumen de lo que se ha hecho con la RST puede leerse en Taboada y Mann (2006) y existe una lista muy completa sobre lo que se ha realizado sobre la RST en http://www.sfu.ca/rst/.

 

REFERENCIAS
ABELEN, E.; REDEKER, G. and THOMPSON, S.A. 1993. The rhetorical structure of US-American and Dutch fund-raising letters. Text 13(3), 323-350.
ANTONIO, J.D. Estrutura retórica e articulação de orações em narrativas orais e em narrativas escritas do português. Araraquara, 2004. Tese (Doutorado em Linguística e Lígua Portuguesa). Faculdade de Ciências e Letras/ Unesp/ Araraquara.
CARLSON, L., OKUROWSKI, M.E. and MARCU, D., 2002. RST Discourse Treebank, LDC2002T07 [Corpus]. Philadelphia: PA: Linguistic Data Consortium.
CORSTON-OLIVER, S., 1998. Identifying the linguistic correlates of rhetorical relations, Proceedings of the ACL Workshop on Discourse Relations and Discourse Markers 1998, pp. 8–14.
CUI, S. 1986. A comparison of English and Chinese expository rhetorical structures. University of California (USA): UCLA dissertation.
DA CUNHA, I., SAN JUAN, E., TORRES-MORENO, J.M., LLOBERESE, M. and CASTELLÓNE, I., 2012. DiSeg 1.0: The first system for Spanish discourse segmentation. Expert Systems with Applications, 39(2), pp. 1671-1678.
DA CUNHA, I. and IRUSKIETA, M., 2010. Comparing rhetorical structures in different languages: The influence of translation strategies. Discourse Studies, 12(5), pp. 563-598.
DA CUNHA, I., TORRES-MORENO, J. and SIERRA, G., 2011. On the Development of the RST Spanish Treebank, 5th Linguistic Annotation Workshop (LAW V '11), 23 June 2011, Association for Computational Linguistics, pp. 1-10.
DECAT, M. B. N. Estrutura retórica e articulação de orações em gêneros textuais diversos: uma abordagem funcionalista. In: MARINHO, Janice Helena Chaves; SARAIVA, Maria Elizabeth Fonseca. (Org.). Estudos da língua em uso: da gramática ao texto. Belo Horizonte: Editora UFMG, 2010, v. , p. 231-262.
GIERING, M. E. A organização retórica de artigos de divulgação científica midiática e a organização sequencial do texto. Desenredo (PPGL/UPF), v. 5, p. 78-99, 2009.
HANNEFORTH, T., HEINTZE, S. and STEDE, M., 2003. Rhetorical parsing with underspecification and forests, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: companion volume of the Proceedings of HLT-NAACL 2003--short papers-Volume 2 2003, Association for Computational Linguistics, pp. 31-33.
IRUSKIETA, M., DÍAZ DE ILARRAZA, A. and LERSUNDI, M., 2013.
Establishing criteria for RST-based discourse segmentation and annotation for texts in Basque. Corpus Linguistics and Linguistic Theory.
IRUSKIETA, M., DÍAZ-DE-ILARRAZA, A. and LERSUNDI, M., 2011. Bases para la implementación de unsegmentadordiscursivopara el euskera, 8th Brazilian Symposium in Information and Human Language Technology (STIL 2011), OCTOBER 2011 2011.

KORZEN, I. and GYLLING, M., 2012. Text structure in a contrastive and translational perspective: on information density and clause linkage in italian and danish. Translation: Computation, Corpora, Cognition, 2(1), pp. 23-46.
MANN, W.C. and THOMPSON, S.A., 1988. Rhetorical Structure Theory: Toward a functional theory of text organization. Text-Interdisciplinary Journal for the Study of Discourse, 8(3), pp. 243-281.
MARCU, D., 2000. The theory and practice of discourse parsing and summarization. Cambridge: The MIT press.
MARCU, D.; CARLSON, L. and WATANABE, M. 2000. The automatic translation of discourse structures. Paper presented at the 1st North American chapter of the Association for Computational Linguistics conference, Seattle (USA), April 30-May 4.
MATTHIESSEN, C.; THOMPSON, S. The structure of discourse and ‘subordination’. In: HAIMAN, J. e THOMPSON, S. (Eds.) Clause Combining in Grammar and Discourse. Amsterdam/Philadelphia: J. Benjamins, 1988. p. 275-329.
MAZEIRO, E.G. and PARDO, T.A.S., 2009. Metodologia de avaliação automática de estruturas retóricas [Methodology for automatic evaluation of rhetorical structures], 7th Brazilian Symposium in Information and Human Language Technology (STIL), 8-11 September 2009.
O'DONNELL, M., 2000. RSTTool 2.4: a markup tool for Rhetorical Structure Theory, First International Conference on Natural Language Generation INLG '00, June12-16 2000, ACL, pp. 253-256.
PARDO, T.A.S., 2006. SENTER: um segmentador sentencial automático para o português do Brasil.
PARDO, T.A.S., 2005. Métodos para análise discursiva automática [Methods for automatic discourse analysis], Instituto de Ciências Matemáticas e de Computação.
PARDO, T.A.S., NUNES, M.G.V. and RINO, L.H.M., 2004. DiZer: An Automatic Discourse Analyzer for Brazilian Portuguese. Advances in Artificial Intelligence–SBIA 2004, , pp. 224-234.
PARDO, T.A.S. and SENO, E.R.M., 2005. Rhetalho: um corpus de referência anotado retoricamente [Rhetalho: a rhetorically annotated reference corpus], Anais do V Encontro de Corpora, 24-25 November 2005.
GUY, R. 2001. Rhetorical styles and newstexts: A contrastive analysis of rhetorical relations in Chinese and Australian news-journal text. ASAA E-Journal of Asian Linguistics and Language-teaching 1(1), 1-22.
SCOTT, D.R., DELIN, J. & HARTLEY, A.F. 1998. Identifying congruent pragmatic relations in procedural texts. Languages in Contrast 1(1), 45-82.
STEDE, M., 2004. The Potsdam commentary corpus, 2004 ACL Workshop on Discourse Annotation, 25-26 July 2004, Association for Computational Linguistics, pp. 96-102.
SUMITA, K., ONO, K., CHINO, T. and UKITA, T., 1992. A discourse structure analyzer for Japanese text, 1992, ICOT, pp. 1133-1140.
TABOADA, M. 2004. Building coherence and cohesion: Task-oriented dialogue in English and Spanish. Amsterdam and Philadelphia: John Benjamins.
TABOADA, M. and MANN, W.C., 2006. Applications of Rhetorical Structure Theory. Discourse Studies, 8(4), pp. 567-588.
Taboada, M. 2006. Discourse Markers as Signals (or Not) of Rhetorical Relations. Journal of Pragmatics, 38(4):567-592.
TABOADA, M. and RENKEMA, J., 2011-last update, Discourse Relations Reference Corpus2012].
TOFILOSKI, M., BROOKE, J. and TABOADA, M., 2009. A syntactic and lexical-based discourse segmenter, 47th Annual Meeting of the Association for Computational Linguistics, 2-7 August 2009, ACL, pp. 77-80.

bottom of page