<!-- received="Thu Jan 14 14:10:39 1999 MET" --> <!-- sent="Thu, 14 Jan 1999 13:58:40 +0100 (MET)" --> <!-- name="Marie-Paule =?iso-8859-1?Q?P=E9ry=2DWoodley?= " --> <!-- email="pery@univ-tlse2.fr" --> <!-- subject="Corpora: WORKSHOP TALN'99" --> <!-- id="v01510101b2c3a8fcf929@[193.55.174.107]" --> <!-- inreplyto="" --> <title>Corpora Jan 1999 to Mar 1999: Corpora: WORKSHOP TALN'99</title> <h1>Corpora: WORKSHOP TALN'99</h1> <b>Marie-Paule =?iso-8859-1?Q?P=E9ry=2DWoodley?= </b> (<a href="mailto:pery@univ-tlse2.fr"><i>pery@univ-tlse2.fr</i></a>)<br> <i>Thu, 14 Jan 1999 13:58:40 +0100 (MET)</i> <p> <ul> <li> <b>Messages sorted by:</b> <a href="date.html#0">[ date ]</a><a href="index.html#0">[ thread ]</a><a href="subject.html#0">[ subject ]</a><a href="author.html#0">[ author ]</a> <!-- next="start" --> <li> <b>Next message:</b> <a href="0001.html">Jan Alexandersson: "Corpora: [E-CFP] 2nd CFP: IJCAI99 WS 'KNOWLEDGE AND REASONING IN PRACTICAL DIALOGUE SYSTEMS'"</a> <!-- nextthread="start" --> </ul> <!-- body="start" -->                          ATELIER TALN'99<br>              (<a href="http://talana.linguist.jussieu.fr/taln99/">http://talana.linguist.jussieu.fr/taln99/</a>)<br>                         12 au 17 juillet 1999,<br>           Institut d'Etudes Scientifiques de Cargse, Corse<br> <p>                 APPEL A COMMUNICATION/ CALL FOR PAPERS<br> <p>           CORPUS ET TAL : POUR UNE REFLEXION METHODOLOGIQUE<br> <p> <p> Le recours aux corpus, aliment par des ressources linguistiques et<br> logicielles toujours plus nombreuses,  devient de plus en plus frquent<br> dans les recherches et les applications en TAL. Cette volution doit<br> s'accompagner d'une rflexion de nature mthodologique. Les corpus sont<br> gnralement perus comme  des stocks de donnes permettant d'acqurir<br> automatiquement des informations linguistiques, mais leur  rle reste <br> valuer clairement.<br> Il existe diffrentes faons d'envisager les corpus. On peut distinguer<br> quelques unes de ces pratiques.<br> Les corpus sont considrs :<br> <p>       - le plus souvent, comme des donnes attestes permettant de<br>   rendre compte du fonctionnement de "la langue". Le corpus facilite la<br>   construction de modles, et constitue en particulier une alternative <br>   l'tablissement de donnes lexicales par introspection. Il peut tre<br>   galement utilis pour valider des modles existants.<br> <p>       - comme des donnes spcifiques,  partir desquelles on tire des<br>   conclusions propres au seul corpus,  dans le cadre d'une application donne<br>   (par exemple, l'acquisition de terminologie dans un domaine spcifique),<br> <p>       - comme des donnes exprimentales dont on peut contrler les variables<br>   (crit vs oral, domaine couvert, vise discursive, etc.) pour les rendre<br>   reprsentatives d'usages spcifiques de la langue et permettre  une<br>   gnralisation des rsultats aux sous-systmes dlimits par ces variables,<br>   voire au systme gnral de la langue (par exemple, pour la constitution<br>   d'analyseurs syntaxiques gnraux). Pour garantir cette<br>   reprsentativit, l'accent est souvent mis sur la taille des corpus.<br> <p> Ces perspectives, de natures trs diffrentes, doivent tre<br> explicites afin que l'on puisse valuer les rsultats obtenus sur<br> corpus, tant sur le plan de la validit que sur celui de la<br> rutilisabilit. Nous souhaitons que cet atelier soit l'occasion de<br> confronter ces diffrents points de vue et de les claircir.<br> <p> Dans ce but, nous nous intresserons aux travaux qui dveloppent une<br> rflexion sur l'utilisation des corpus pour le TAL et/ou la<br> linguistique.  Les domaines abords par les articles ainsi que les<br> mthodes employes pourront couvrir l'ensemble des thmes de la<br> confrence TALN. Nous encourageons les propositions de contribution<br> qui problmatisent le recours aux corpus et posent nettement certaines<br> des questions suivantes :<br> <p>       - pourquoi recourt-on aux corpus dans le travail dcrit ?<br>       - selon quels critres constituer le corpus ? Ou, si un corpus<br>   est d'emble disponible pour l'application vise, comment le<br>   caractriser pour pouvoir valuer la porte des rsultats de son<br>   utilisation ? Comment remplit-on le cas chant des objectifs de<br>   reprsentativit ?<br>       - les rsultats obtenus sont-ils lis  ce corpus, sont-ils<br>   gnralisables ?<br>       - comment choisit-on les outils  mettre en oeuvre ? Quelles<br>   sont les consquences sur le plan mthodologique ?<br> <p> <p> <p> *** COMITE D'ORGANISATION ***<br> <p>  Anne Condamines, Ccile Fabre, Marie-Paule Pry-Woodley<br> ERSS (Equipe de Recherche en Syntaxe et Smantique)<br> <p> <p> COORDONNEES :<br> <p> ERSS, Maison de la Recherche, 5 alles A. Machado, 31058 Toulouse Cedex<br> (acondami,cfabre,pery)@univ-tlse2.fr<br> tl : 05 61 50 36 09 ou 05 61 50 36 08, fax : 05 61 50 46 77<br> <p> <p> *** COMITE DE PROGRAMME ***<br> <p> <p> Andre Borillo (ERSS, Toulouse)<br> Didier Bourigault (ERSS, Toulouse)<br> Teresa Cabre (IULA, Universitat Pompeu Fabra, Barcelone)<br> Anne Condamines (ERSS, Toulouse)<br> Ccile Fabre (ERSS, Toulouse)<br> Bernard Fradin (LLI, Villetaneuse)<br> Benot Habert (UMR 9952, ENS Fontenay/St-Cloud)<br> Fabrice Issac (UTC Compigne)<br> John Mac Naught (Center for Computational Lingusitics, UMIST, Manchester)<br> Adeline Nazarenko (LIPN, Villetaneuse)<br> Marie-Paule Pry-Woodley (ERSS, Toulouse)<br> Andr Salem (ILPGA /Sorbonne nouvelle - Paris 3)<br> Pierre Zweigenbaum (DIAM/SIM AP-HP, Paris)<br> <p> <p> *** DATES IMPORTANTES ***<br> <p> 19 mars : Date limite de soumission des articles<br> 1 mai : Notification<br> 15 mai : Version finale<br> <p> <p> *** FORMAT DES SOUMISSIONS ***:<br> <p> Les articles soumis doivent suivre les modalits de soumission de<br> TALN'99. Ils ne devront pas dpasser 10 pages en Times 12, espacement<br> simple, soit environ 3000 mots, figures, exemples et rfrences compris,<br> et doivent tre conformes au style disponible sur le site de<br> TALN'99 (<a href="http://talana.linguist.jussieu.fr/taln99/">http://talana.linguist.jussieu.fr/taln99/</a>).<br> <p> 4 copies des articles doivent parvenir aux organisatrices de l'atelier<br> avant le 19 mars 1999. La version finale sera publie dans les actes du<br> Workshop.<br> <p> <p> *** LANGUE DE L'ATELIER ***<br> <p> Les langues officielles pour les articles et les communications sont<br> le franais et l'anglais.<br> <p> <p> *** ADRESSE DE L'ENVOI ***<br> <p> Atelier TALN'99<br> ERSS<br> Maison de la Recherche<br> 5 Alles Antonio Machado<br> 31058 TOULOUSE Cedex, FRANCE<br> *******************************************************************************<br> <p>                          CALL FOR PAPERS<br> <p> <p>                 CORPORA AND NLP: REFLECTING ON METHODOLOGY<br> <p> <p> <p> With current rapid developments in linguistic resources and analytical<br> software, more and more NLP research, whether descriptive or applied, is<br> turning towards the use of corpora. These new research practices make it<br> necessary to review methodological principles.<br> Corpora are mostly perceived as banks of data allowing automatic access to<br> linguistic information, but their role needs to be assessed more precisely.<br> Researchers resort to corpora for a number of different reasons:<br>  - mostly they view them as stores of occurrences which can be used for the<br> description of the linguistic system. Corpora facilitate the elaboration of<br> models and constitute an alternative to the introspective construction of<br> data. They can also help validate existing models.<br>  - on the other hand, they are also used as specific data, forming the basis<br> for observations which apply only to the corpus under study, with a<br> particular application in mind (e.g. to acquire terminological data in a<br> specialised field).<br>  - corpora can also constitute experimental data where variables may be<br> controlled (written vs spoken, domain, discourse function, etc.) in order<br> to make them representative of specific uses of language and allow<br> generalisation of results to the sub-systems defined by these variables, or<br> even to the overall system of the language (e.g. for the elaboration of<br> parsers). The problem of representativity is often then tackled in terms of<br> corpus size.<br> <p> These conceptions differ quite fundamentally , and must be made explicit if<br> we are to be able to evaluate results from corpus analysis, both as to<br> their validity and their reusability. We would like this workshop to<br> provide researchers with an opportunity to confront views and approaches,<br> so as to clarify them.<br> <p> With this objective in mind, we call for papers which take a reflective<br> approach to the use of corpora in NLP and/or linguistic research. Domains<br> and methods may range over any of the TALN conference themes. We particularly<br> welcome studies which look critically at their corpus-based methodology and<br> ask some of the following questions:<br>  - why does the work described make use of a corpus?<br>  - what criteria should inform the design of the corpus? Or, if there is an<br> existing corpus corresponding to the aims of the study, how should it be<br> characterised to allow proper evaluation of the scope of the results? How<br> can representativity be achieved?<br>  - are the results of an analysis entirely tied to the corpus used or are<br> they generalisable?<br>  - what criteria can guide the choice of analytical tools? What are the<br> methodological consequences of these choices?<br> <p> <p> *** ORGANISING COMMITTEE ***<br> <p> Anne Condamines, Ccile Fabre, Marie-Paule Pry-Woodley<br> ERSS (Equipe de Recherche en Syntaxe et Smantique)<br> <p> <p> ADDRESS :<br> ERSS, Maison de la Recherche, 5 alles A. Machado, 31058 Toulouse Cedex<br> (acondami,cfabre,pery)@univ-tlse2.fr<br> tel : +33 (0)5 61 50 36 09 ou +33 (0)5 61 50 36 08, fax : +33 (0)5 61 50 46 77<br> <p> <p> *** PROGRAM COMMITEE ***<br> <p> Andre Borillo (ERSS, Toulouse)<br> Didier Bourigault (ERSS, Toulouse)<br> Teresa Cabre (IULA, Universitat Pompeu Fabra, Barcelone)<br> Anne Condamines (ERSS, Toulouse)<br> Ccile Fabre (ERSS, Toulouse)<br> Bernard Fradin (LLI, Villetaneuse)<br> Benot Habert (UMR 9952, ENS Fontenay/St-Cloud)<br> Fabrice Issac (UTC Compigne)<br> John Mac Naught (Center for Computational Lingusitics, UMIST, Manchester)<br> Adeline Nazarenko (LIPN, Villetaneuse)<br> Marie-Paule Pry-Woodley (ERSS, Toulouse)<br> Andr Salem (ILPGA /Sorbonne nouvelle - Paris 3)<br> Pierre Zweigenbaum (DIAM/SIM AP-HP, Paris)<br> <p> <p> *** IMPORTANT DATES ***<br> <p> 19 March: Deadline for submission of papers<br> 1 May: Notification of acceptance/rejection<br> 15 May: Deadline for final version<br> <p> <p> ***     SUBMISSION FORMAT ***<br> Papers submitted must conform to the submission format of TALN'99. They<br> should not exceed 10 pages of text in Times 12 with single line-spacing,<br> i.e. approximately 3000 words, figures, examples and references included.<br> They must conform to the style sheet available on the TALN'99 web site<br> (<a href="http://talana.linguist.jussieu.fr/taln99">http://talana.linguist.jussieu.fr/taln99</a>).<br> <p> <p> *** LANGUAGES ***<br> The official languages for papers and presentations are French and English<br> <p> <p> <p> *** ADDRESS ***<br> <p> ATELIER TALN'99<br> ERSS<br> Maison de la Recherche<br> 5, Alles Antonio Machado,<br> 31058 Toulouse cedex, FRANCE<br> <p> <p> <p> <p>  ********************************** **********************************<br>  * Marie-Paule PERY-WOODLEY        *                                 *<br>  * Equipe de Recherche en Syntaxe  *                                 *<br>  *    et Semantique                *                                 *<br>  * Maison de la Recherche          *  Telephone :+33(0)5 61 50 36 09 *<br>  * 5 allees Antonio-Machado        *  Telecopie :+33(0)5 61 50 46 77 *<br>  * 31058 TOULOUSE CEDEX            *  Email:  <a href="mailto:pery@univ-tlse2.fr">pery@univ-tlse2.fr</a>     *<br>  *                                 *                                 *<br>  ********************************** **********************************<br> <!-- body="end" --> <p> <ul> <!-- next="start" --> <li> <b>Next message:</b> <a href="0001.html">Jan Alexandersson: "Corpora: [E-CFP] 2nd CFP: IJCAI99 WS 'KNOWLEDGE AND REASONING IN PRACTICAL DIALOGUE SYSTEMS'"</a> <!-- nextthread="start" --> </ul> 
