Stages / Research Experience

Cet article n'est pas disponible en français.

Stages 2017-2018

LeCSeL, EA TransCrit (1569), Université Paris 8
Descriptifs au dessous

Acting and Speaking – The Grammar of Gesture
 – Spoken Tunisian Arabic Spoken Transcription
 – Spoken American English Spoken Transcription

Expressing Opinion  
 – Czech Spoken Transcription (rémunéré)
 – French Spoken Transcription (rémunéré)
 – Polish Spoken Transcription (rémunéré)
 – Portuguese Spoken Transcription (rémunéré)
 – Romanian Spoken Transcription (rémunéré)
 – Russian Spoken Transcription (rémunéré)

Mixed input in L2 acq. – Questionnaire Data Colection (non- rémunéré)

Facial expressions and sarcasm
 – Video annotation of facial expressions in English (non- rémunéré)
 – Video annotation of facial expressions in French (non- rémunéré)

Analyse acoustique des locuteur/trices bilingues

The Use of Emojis  
 – Text crawling in French (non-rémunéré)
 – Text crawling in English (non-rémunéré)

Multivariate Polysemy – Semantic Annotation of written text (non-rémunéré)

Representing Asylum Seekers in News Press
 – Semantic annotation of written French (non-rémunéré)
  – Semantic annotation of written English (non-rémunéré)

Metaphoric Structure of Emotions
– Semantic Annotation of ANGER in Russian text (non-rémunéré)
 – Semantic Annotation of ANGER in English text (non-rémunéré)
 – Semantic Annotation of DESIRE in English text (non-rémunéré)
 – Semantic Annotation of DESIRE in Russian text (non-rémunéré)

Andalusian Dialect Variation – Transcription of Spanish audio corpora



Stages Descriptions

Expressing Opinion – Spoken Transcription

Stages dans la transcription de la langue parlée pour les langues diverses

Domaine – Linguistique de coprus
Resposnable : Dylan Glynn - ; Camille Debras -
Langue : stages divers (Czech, French, Polish, Portuguese, Romanian, Russian)
Durée : à négocier (50h - 120h)
Dates : à négocier (Feb – Dec. 2018)

Taches :
Transcription de la parole et annotation des gestes dans des enregistrements vidéos d’interactions multipartites (interactions entre plus de deux personnes)
Alignment des transcriptions sur la vidéo grâce aux logiciels ELAN
Traduction de la transcription de la parole en français ou en anglais
Annotation de certaines formes gestuelles

Formation :
Une formation à l’utilisation des logiciels CLAN et ELAN sera proposée.
Les vacataires seront formés à l’annotation des formes gestuelles.

Tasks :
Transcribe speech and annotate gesture in videotaped recordings of multiparty interactions (i.e. interactions between more than two people)
Align the transcription with the video in dedicated software CLAN and/or ELAN
Provide a basic translation of the transcription of speech into French or English
Annotate certain gesture forms

Training :
Training in the use of CLAN and ELAN will be provided.
Transcribers will be trained in the annotation of basic gesture forms and functions.
This transcription and annotation task will provide

Multivariate Polysemy

Semantic annotation of corpus data to test previous theoretical hypotheses about prototype effects in language structure

Domaine – Linguistique de corpus / Sémantique
Resposnable : Dylan Glynn -
Langue : English
Durée : à négocier (50h - 120h)
Dates : à négocier (2017 – 2018)

Taches :
Annotation of a large and complex set of semantic features to detailed contexts of use. The features are based on previous research in theoretical linguistics on the prototype structured of semasiological variation.

Formation :
Semantic Annotation – training and detailed semantic analysis of natural language
FileMakerPro – training in advanced relational data base software, the setting up and use of relational databases


Mixed input in L2 Acquisition

The collating and transcription of questionnaires destined to identify the effects of mixed input on L2 acquisition

Domaine – L2 Acquisition
Resposnable : Mériem Guèche -
Langue : anglaise
Durée : à négocier (50h - 120h)
Dates : à négocier (2017 - 2018)

Taches :
Transcription of hand written texts in English.
Cleaning of transcribed texts.
Lematising and concordancing of transcribed texts.

Formation :
Lemmatisation (CST’s lemmatiser)
Calculating vocabulary size (Text Content Analysis Tool)
Calculating type token ratios (Excel)


Acting and Speaking – The Grammar of Gesture

Domaine – Linguistique de corpus
Resposnable : Amira Arous -
Langue : anglaise, arabe tunisienne
Durée : à négocier (50h - 120h)
Dates : à négocier (2017 - 2018)

Taches :
Contactez le responsable

Formation :
Contactez le responsable


Metaphoric Structure of Emotions

Deux stages (en englais et en russe) dans l’annotation sémantique de l’expression métpahorique de la colère.

Deux stages (en englais et en russe) dans l’annotation sémantique de l’expression métpahorique du désire et du mécontentement.

Domaine – Sémantique / Linguistique de corpus
Resposnable : Dylan Glynn, Avgustina Biryukova
Langue : Anglaise / Russe
Durée : à négocier (50h - 120h)
Dates : à négocier (Dec 2017 – Dec. 2018)

Taches :
Tokensiation – The manual identification of metaphoric expressions in personal diaries written by young people.

Annotation – The manual annotation of various dimensions of the experience ANGER and DESIRE identified in social psychology research.

Formation :
Semantic Annotation – training and detailed semantic analysis of natural language
FileMakerPro – training in advanced relational data base software, the setting up and use of relational databases


Facial expressions and sarcasm

Domaine – Corpus Linguistics, Gesture Studies
Resposnable : Sabina Tabacaru -
Langue : French, English
Durée : à négocier (50h - 120h)
Dates : à négocier (2017 - 2018)

Taches :

Formation :


Analyse acoustique des locuteur/trices bilingues

Analyse acoustique de voyelles produites par des locuteur/trices bilingues Anglais L1 / Français L2

Domaine – phonétique
Resposnable : Erwan Pépiot -
Langue : anglaise / française
Durée : à négocier (50h - 120h)
Dates : à négocier (2017 - 2018)


Tâches  : Relevé des valeurs de F1, F2 et F3 sur des voyelles produites par des locutrices et locuteurs bilingues Anglais L1 / Français L2 à l’aide du logiciel PRAAT, dans le cadre d’une étude portant sur la voix et le genre.

Formation  : Le/la stagiaire aura l’opportunité de développer ses compétences en phonétique expérimentale et sa pratique du logiciel PRAAT.


Representing Asylum Seekers in News Press

Deux stages (anglais, français) dans l’annotation sémantique – sur les attitudes implicites dans la presse.

Domaine – analyse du discours, linguistique de corpus
Resposnable : Anissa Berracheche -
Langue : anglaise ou française
Durée : à négocier (50h - 120h)
Dates : à négocier (2017 - 2018)

Taches :

Formation :



Andalusian Dialect Variation – Transcription of Spanish audio corpora

Taches :

Formation :


Use of emoji in English

Domaine – Sémantique / Linguistique de corpus
Resposnable : Sabina Tabacaru
Langue : anglaise, française
Durée : à négocier (50h - 120h)
Dates : à négocier (2017-2018)
Non- rémunéré