** Recup url : http://vulab.ias.unu.edu/forum/papillon/msg00357.html [PAPILLON] Call for Papers Papillon 02 First Version
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[PAPILLON] Call for Papers Papillon 02 First Version



Dear all,

Please find enclosed a first version of the call for papers for
the Papillon 2002 Workshop on multilingual lexical databases.

Papillon02Appel_MM_FA.html

Title: Papillon 2002 Announcement v2

WORKSHOP PAPILLON-2002 on Multilingual LexicalDatabases
Tokyo,16-18 juillet/July 2002

Annonce No2 / Announcement No2 07 March 2002
Lieu /Venue: NII, Hitotsubashi, Chiyoda-ku, Tokyo, Japan


Présentation

Les bases lexicales multilingues sont des serveursde données lexicales structurées. Ces données peuvent être utilisé soit pardes humains pour définir leur propre dictionnaire soit par des applicationsde traitement des langues.

Ces dernieres années, nous assistons à uneaccumulation de ressources lexicales dans les laboratoires de traitementautomatique de la langue ainsi que sur Internet. les bases lexicalesmultilingues tentent de résoudre ce problème d'accumulation enorganisant la manipulation et l'accès à ces ressources. Ces bases sont unpoint central de la recherche dans les sciences du langage et dans ledéveloppement des technologies de la langue. Comme les bases de donnéesgénomiques, les bases lexicales sont complexes, évoluent, constituent desserveur richement annotés et posent des problèmes scientifiques durs dans denombreux domaines.

Les buts de cet atelier sont de rendre compte de larecherche existante dans les bases de données multilingues et d'identifierles problèmes clés. Plus generalement, l'atelier aidera à definir desquestions de recherche de la nouvelle "communauté des bases lexicalesmultilingues" autour de Papillon et initiera les échanges sur les problèmesen cours et les résultats entre cette communauté et les autres communautés(lexicographie, traduction, interfaces hommes-machine, bases de données ausens large, etc.).

Papillon est un projet de construction et d'usagecollaboratifs sur la toile d'une base lexicale multilingue et dedictionnaires derives en source ouverte (français, anglais, japonais, lao,thai et vietnamien) L'atelier est destiné à des participants de plusieursspecialités incluant les bases de données, la linguistique, lalinguistique-informatique, les annotations et XML.

L'atelier traitera une sélection des pointssuivants :

Structures

  • Microstructures des articles ou représentation lexicale
  • Macrostructures des dictionnaires et architecture générale
  • Modèles incluant la parole, les données multimodales, et les metadonnees.

Données Lexicales

  • Standards de metadonnées fournissant de l'aide pour les bases lexicales.
  • Méthodes systématiques pour peupler une base lexicale
  • Problèmes de récupération de dictionnaires
  • Extraction de données mono et bilingues
  • Problèmes de traduction interne au dictionnaire

Bases de données

  • Support bases de données (par exemple quelle technologie de bases de données standard est compatible avec les bases lexicales?)
  • Requetes d'annotations multicouches
  • Extensions du langage de requetes XML (XQL)
  • Analyse des languages ad hoc existants
  • Methodes d'indexation appropriées pour des chaines linguistiques et des structures d'archivage.

Autres sujets

  • Ergonomie, Interfaces, protocoles d'accès aux données
  • Gestion sociale du dictionnaire

Overview

Multilingual lexical databases are repositories of structured information toprovide an easy access to all available meanings of words and to allow the creationof a number of computer programs that will help to analyze texts using thesedatatabases.

Multilingual lexical databases are repositories of structuredlexical data. This data can be used either by humans to derive their own dictionary, eitherby NLP applications.

Over the last decade, we assist to an accumulation of lexical resourcesin NLP laboratories and on the Internet. The lexical databases try to solve this accumulation problem by organizing the manipulation and the access to these resources. These databases are a central point of research in the language sciences, and in the development of new human language technologies. Like genomic databases, lexical databases are complex, evolving andrichly annotated repositories, and pose interesting challenges for efficientrepresentation, indexing and query.

The goals of the workshop are to take stock of existing research in multilingual lexical databases and to identify the key problems. More broadly, the workshop will help define the research questions of the newPapillon "multilingual lexical database community" and initiate the interchangeof relevant ongoing problems and results between this community and other communities (lexicography, translation, human-computer interactions, database community at large).

Papillon is a project of construction and collaborative usage on the web of a multilinguallexical database and electronic dictionaries derived in open source(French, English, Japanese, Thai, Lao, vietnamese)The workshop is expected to attract participants from a range of specialtiesincluding databases, linguistics, computational linguistics, annotation and markup.

The workshop will address a selection of the following topics:

Structures

  • Microstructures of the Entries and Lexical Representation
  • General Architecture and Macrostructure of the Dictionary
  • Models for lexical databases including speech, multimodal data, and metadata.

Lexical Data

  • Metadata standards serving as finding aids for lexical databases.
  • Systematic methods for populating lexical databases.
  • Dictionary recuperation Issues.
  • Monolingual data and bilingual data extraction.
  • Dictionary Internal Translation Issues.

Databases

  • Database support (e.g. what standard database technology has proven worthwhile for lexical databases?)
  • Query of multilayer annotations.
  • Extensions of XML query languages
  • Analysis of existing ad hoc query languages
  • Appropriate indexing methods for linguistic strings and structures archiving.

Other Topics

  • Ergonomy, Interface and acces protocol to the Lexical data
  • Lexical database social issues

Programme / Program

Le programme sera varié et prévu pour maximiser la coopération entre les spécialitées, et pour permettre des discussions ouvertes étendues.Les composantes du programme seront entre autres :

  • Des ateliers sur les différents modèles et structures linguistiques et lexicales par exemple, la structure des articles monolingues, les langages de requêtes semi-structurés;
  • Des sessions de posters sur des lexiques et textes annotés (et peut être d'autres),
  • Des présentations de papiers rapportant des nouvelles recherches.
  • Des démonstration de systèmes pour créer et gérer les données lexicales.

The program will have a varied format, designed to maximize cross-fertilizationamong the various specialties, and to allow extended open discussion. Components ofthe program will include:

  • Tutorials on relevant models from linguistics, databases or annotation, e.g. the structure of lexical entries and semi-structured query languages.
  • Panel sessions on annotated text and lexicons (and possibly others),
  • Paper presentations reporting new research.
  • Demonstrations of systems for creating and/or managing lexical data.

DATES IMPORTANTES /IMPORTANT DATES

  • 2002/04/31 Date limite de soumission / Submission Deadline
  • 2002/05/20 Notification d'acceptation / Notice of Acceptance
  • 2002/06/15 Version finale / Camera Ready Papers
  • 2002/07/15 Arrivée conseillée / Advised Arrival
  • 2002/07/18 Fin / end

Appel à communications / Call for Papers

Les papiers techniques sur les aspects informatiques (developpement du serveurweb, utilisation d'une base de donnees, developpement d'interfaces, etc.),les aspects linguistiques (microstructure commune monolingue, problemes specifiquesaux langues, manuels d'encodage, etc.) ainsi que les aspects sociaux (commentmotiver les contributeurs, comment agrandir la communauté, etc. ) sont tous bienvenus.

Technical papers about computer related aspects (development of the web server,use of a database, development of interfaces, etc.), linguistic aspects (monolingualcommon microstructure, language specific encoding problems, best practice, etc.)as well as social aspects (how to open the community, how to motivate the contributors)are all welcomed.

Envoyez vos papiers aux formats rtf, pdf, ps, html à l'adresse suivante :mailto:mangeot@nii.ac.jp

Please send your papers in rtf, pdf, ps or html formats to the followingaddress: mailto:mangeot@nii.ac.jp


Comité d'organisation local / Local Organizing Committee

President Mathieu Mangeot, NII, Tokyo

  • Frederic Andrès, NII, Tokyo
  • David Thévenin, NII, Tokyo
  • Shiho Kurosawa, NII, Tokyo

Comité de programme / Program Committee

President Christian Boitet, GETA-CLIPS, Grenoble

  • Mr. Frederic Andrès, NII,Tokyo
  • Mr. François Brown-de-Colstoun, Ambassade de France, Tokyo
  • Ms. Françoise Guelle, Ambassade de France, Tokyo
  • Mr. Kyo Kageura, NII,Tokyo
  • Ms. Asanee Kawtrakul, KU, Bangkok
  • Mr. Mathieu Lafourcade,LIRMM, Montpellier
  • Mr. Francois Lareau, UdM, Montreal
  • Mr. Mathieu Mangeot, NII,Tokyo
  • Mr. Emmanuel Planas, GETA-CLIPS, Grenoble
  • Mr. Alain Polguère, UdM, Montreal
  • Mr. Gilles Sérasset, GETA-CLIPS, Grenoble
  • Ms. Kumiko Tanaka Ishii, Tokyo University, Tokyo
  • Mr. David Thévenin, NII, Tokyo
  • Ms. Mutsuko Tomokiyo, GETA-CLIPS, Grenoble
  • Mr. Michael Zock, LIMSI, Orsay

Informations diverses / Miscellaneous Information

The committee list may change a little bit as I did not receive the agreement of
everybody.

Best Regards,

Mathieu MANGEOT

Mathieu MANGEOT-LEREBOURS | National Institute of Informatics
Email: mangeot@nii.ac.jp | Software Research Division
Tel: +81-3-4212-2672 | Hitotsubashi 2-1-2-1913
Fax: +81-3-3556-1916 | Chiyoda-ku Tokyo 101-8430 Japan