** Recup url : http://vulab.ias.unu.edu/forum/papillon/msg00378.html [PAPILLON] Papillon 02: Deadline Extension 31 May text version
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[PAPILLON] Papillon 02: Deadline Extension 31 May text version



				Atelier PAPILLON-2002 Workshop				sur les bases lexicales multilingues				on Multilingual Lexical DatabasesTokyo, 16-18 juillet/July 2002Annonce No5 / Announcement No5 10 April 2002Lieu / Venue: NII, Hitotsubashi, Chiyoda-ku, Tokyo, Japan========================================================================       ****************************************************       * Date limite de soumission étendue au 31 mai 2002 *       * Submission deadline extended to the 31 May 2002  *       ****************************************************========================================================================ENGLISH VERSION BELOW				PrésentationLes bases lexicales multilingues sont des serveurs de données lexicalesstructurées. Ces données peuvent être utilisées soit par des humainspour définir leur propre dictionnaire soit par des applications detraitement des langues.Ces dernieres années, nous assistons à une accumulation de ressourceslexicales dans les laboratoires de traitement automatique de la langueainsi que sur Internet. les bases lexicales multilingues tentent derésoudre ce problème d'accumulation en organisant la manipulation etl'accès à ces ressources. Ces bases sont un point central de larecherche dans les sciences du langage et dans le développement destechnologies de la langue. Comme les bases de données génomiques, lesbases lexicales sont complexes, évoluent, constituent des serveurrichement annotés et posent de difficiles problèmes scientifiques dansde nombreux domaines.Les buts de cet atelier sont de rendre compte de la recherche existantedans les bases de données multilingues et d'identifier les problèmesclés. Plus généralement, l'atelier aidera à definir des questions derecherche de la nouvelle "communauté des bases lexicales multilingues"autour de Papillon et initiera les échanges sur les problèmes en courset les résultats entre cette communauté et les autres communautés(lexicographie, traduction, interfaces hommes-machine, bases de donnéesau sens large, etc.).Papillon est un projet de construction et d'usage collaboratifs sur latoile d'une base lexicale multilingue et de dictionnaires dérivés ensource ouverte (français, anglais, japonais, lao, thai et vietnamien)L'atelier est destiné à des participants de plusieurs specialitésincluant les bases de données, la linguistique, lalinguistique-informatique, les annotations et XML.L'atelier traitera une sélection des points suivants :Structures•  Microstructures des articles ou représentation lexicale•  Macrostructures des dictionnaires et architecture générale•  Modèles incluant la parole, les données multimodales, et lesmetadonnées.Données Lexicales•  Standards de metadonnées fournissant de l'aide pour les baseslexicales.•  Méthodes systématiques pour peupler une base lexicale•  Problèmes de récupération de dictionnaires• Extraction de données mono et bilingues•  Problèmes de traduction interne au dictionnaireBases de données•  Support bases de données (par exemple quelle technologie de bases dedonnées standard est compatible avec les bases lexicales?)•  Requetes d'annotations multicouches•  Extensions du langage de requêtes XML (XQL)•  Analyse des languages ad hoc existants•  Méthodes d'indexation appropriées pour des chaînes linguistiques  et des structures d'archivage.Autres sujets•  Ergonomie, Interfaces, protocoles d'accès aux données•  Gestion sociale du dictionnaire------------------------------------------------------------------------				OverviewMultilingual lexical databases are repositories of structuredinformation to provide an easy access to all available meanings of wordsand to allow the creation of a number of computer programs that willhelp to analyze texts using these datatabases.Multilingual lexical databases are repositories of structured lexicaldata. This data can be used either by humans to derive their owndictionary, either by NLP applications.Over the last decade, we assist to an accumulation of lexical resourcesin NLP laboratories and on the Internet. The lexical databases try tosolve this accumulation problem by organizing the manipulation and theaccess to these resources. These databases are a central point ofresearch in the language sciences, and in the development of new humanlanguage technologies. Like genomic databases, lexical databases arecomplex, evolving and richly annotated repositories, and poseinteresting challenges for efficient representation, indexing and query.The goals of the workshop are to take stock of existing research inmultilingual lexical databases and to identify the key problems. Morebroadly, the workshop will help define the research questions of the newPapillon "multilingual lexical database community" and initiate theinterchange of relevant ongoing problems and results between thiscommunity and other communities (lexicography, translation,human-computer interactions, database community at large).Papillon is a project of construction and collaborative usage on the webof a multilingual lexical database and electronic dictionaries derivedin open source (French, English, Japanese, Thai, Lao, vietnamese) Theworkshop is expected to attract participants from a range of specialtiesincluding databases, linguistics, computational linguistics, annotationand markup.The workshop will address a selection of the following topics:Structures•  Microstructures of the Entries and Lexical Representation•  General Architecture and Macrostructure of the Dictionary•  Models for lexical databases including speech, multimodaldata, and metadata.Lexical Data•  Metadata standards serving as finding aids for lexical database,•  Systematic methods for populating lexical databases,•  Dictionary recuperation Issues,•  Monolingual data and bilingual data extraction,•  Dictionary Internal Translation Issues.Databases•  Database support (e.g. what standard database technology has provenworthwhile for lexical databases?)•  Query of multilayer annotations•  Extensions of XML query languages•  Analysis of existing ad hoc query languages•  Appropriate indexing methods for linguistic strings andstructures archiving.Other Topics•  Ergonomy, Interface and acces protocol to the Lexical data•  Lexical database social issues========================================================================				ProgrammeLe programme sera varié et prévu pour maximiser la coopération entre lesspécialités, et pour permettre des discussions ouvertes étendues.Les composantes du programme seront entre autres :•  Des ateliers sur les différents modèles et structures linguistiqueset lexicales par exemple, la structure des articles monolingues, leslangages de requêtes semi-structurés;•  Des sessions de posters sur des lexiques et textes annotés  (et peut être d'autres);•  Des présentations de papiers rapportant des nouvelles recherches;•  Des démonstrations de systèmes pour créer et gérer les donnéeslexicales.------------------------------------------------------------------------  				ProgramThe program will have a varied format, designed to maximizecross-fertilization among the various specialties, and to allow extendedopen discussion.Components of the program will include:• Tutorials on relevant models from linguistics, databases orannotation, e.g. the structure of lexical entries and semi-structuredquery languages;• Panel sessions on annotated text and lexicons (and possibly others);• Paper presentations reporting new research;• Demonstrations of systems for creating and/or managing lexical data.========================================================================				DATES IMPORTANTES /IMPORTANT DATES• 2002/04/31 Date limite de soumission / Submission Deadline• 2002/05/20 Notification d'acceptation / Notice of Acceptance• 2002/06/15 Version finale / Camera Ready Papers• 2002/07/15 Arrivée conseillée / Advised Arrival• 2002/07/18 Fin / end========================================================================				Appel à communicationsLes papiers techniques sur les aspects informatiques (développement duserveur web, utilisation d'une base de données, développementd'interfaces, etc.), les aspects linguistiques (microstructure communemonolingue, problèmes spécifiques aux langues, manuels d'encodage, etc.)ainsi que les aspects sociaux (comment motiver les contributeurs,comment agrandir la communauté, etc. ) sont tous bienvenus.Envoyez vos papiers complets rédigés en anglais aux formats rtf, pdf, ps,html à l'adresse suivante : mailto:mangeot@nii.ac.jpNous vous conseillons fortement d'utiliser le modèle de Springer Verlagdisponible à l'adresse suivante :http://www.springer.de/comp/lncs/authors.html------------------------------------------------------------------------				Call for PapersTechnical papers about computer related aspects (development of the webserver, use of a database, development of interfaces, etc.), linguisticaspects (monolingual common microstructure, language specific encodingproblems, best practice, etc.) as well as social aspects (how to openthe community, how to motivate the contributors) are all welcomed.Please send your full papers written in Engllish in rtf, pdf, ps or htmlformats to the following address: mailto:mangeot@nii.ac.jpWe strongly recommend you to use the Springer Verlag template availableat the following address: http://www.springer.de/comp/lncs/authors.html========================================================================				Comité d'organisation local / Local Organizing CommitteePresident Mathieu Mangeot, NII, Tokyo•  Frederic Andrès, NII, Tokyo•  David Thévenin, NII, Tokyo•  Shiho Kurosawa, NII, Tokyo========================================================================				Comité de programme / Program CommitteePresident Christian Boitet, GETA-CLIPS, Grenoble•  Mr. Frederic Andrès, NII,Tokyo•  Mr. François Brown de Colstoun, Ambassade de France, Tokyo•  Ms. Françoise Guelle, Ambassade de France, Tokyo•  Mr. Kyo Kageura, NII,Tokyo•  Ms. Asanee Kawtrakul, KU, Bangkok•  Mr. Mathieu Lafourcade,LIRMM, Montpellier•  Mr. Francois Lareau, Université de Montréal, Montreal•  Mr. Mathieu Mangeot, NII,Tokyo•  Mr. Emmanuel Planas, GETA-CLIPS, Grenoble•  Mr. Alain Polguère, Université de Montréal, Montreal•  Mr. Gilles Sérasset, GETA-CLIPS, Grenoble•  Ms. Kumiko Tanaka Ishii, Tokyo University, Tokyo•  Mr. David Thévenin, NII, Tokyo•  Ms. Mutsuko Tomokiyo, GETA-CLIPS, Grenoble•  Mr. Michael Zock, LIMSI, OrsayInformations diverses / Miscellaneous Information•  NII: http://www.nii.ac.jp/•  CLIPS: http://www-clips.imag.fr/•  Papillon: http://www.papillon-dictionary.org/•  E-mail list manager: mailto:mangeot@nii.ac.jpMathieu MANGEOT-LEREBOURS | National Institute of InformaticsEmail: mangeot@nii.ac.jp  | Software Research DivisionTel: +81-3-4212-2672      | Hitotsubashi 2-1-2-1913Fax: +81-3-3556-1916      | Chiyoda-ku Tokyo 101-8430 Japan