Riorganizzare SignWriting per favorire la ricerca linguistica sulle Lingue dei Segni

paper, specified "long paper"
Authorship
  1. 1. Claudia Savina Bianchini

    Université de Poitiers (University of Poitiers)

  2. 2. Fabrizio Borgia

    Sapienza Università di Roma (Sapienza University of Rome)

  3. 3. Maria De Marsico

    Sapienza Università di Roma (Sapienza University of Rome)

Work text
This plain text was ingested for the purpose of full-text search, not to preserve original formatting or readability. For the most complete copy, refer to the original conference program.

Le Lingue dei Segni (LS) sono lingue utilizzate dalla maggior parte dei sordi del mondo per comunicare tra di loro; si tratta di lingue storico-naturali caratterizzate dall’uso del canale visuo‑gestuale. La loro rappresentazione grafica è una sfida per la ricerca linguistica in quanto le LS non hanno ancora sviluppato un sistema di scrittura condiviso dalla comunità e, al contempo, non possono essere rappresentate adattando un sistema di scrittura nato per le lingue vocali (come l’alfabeto latino o anche l’alfabeto fonetico internazionale) a causa della differenza di canale comunicativo e della conseguente multi‑linearità della lingua. Tale assenza provoca difficoltà nei compiti di notazione (ossia rappresentazione delle forme significanti), annotazione (ossia rappresentazione dei fenomeni linguistici) e successiva analisi di produzioni segnate.

Attualmente, la maggior parte delle analisi delle LS si basa sull’uso delle cosiddette “glosse”, etichette verbali nella lingua vocale del ricercatore che permettono ‑ secondo il loro scopo e il loro grado di complessità ‑ di annotare il significato del segno, le caratteristiche della sua forma significante o anche altre informazioni che lo riguardano. Sebbene possa trattarsi di etichette anche molto precise, rimane difficile – se non impossibile – ricostruire la forma significante delle produzioni segnate attraverso queste etichette: si tratta quindi di soluzioni che permettono l’annotazione ma non la notazione delle LS. La soluzione usata, che aggira il problema della rappresentazione grafica della lingua, è quella di associare temporalmente a tali etichette il video originale, grazie all’uso di software di annotazione linguistica come ELAN1 o ANVIL2.

Segni rappresentati con SW (1) e specifica degli elementi descritti (2):(a) espressione facciale, (b) direzione dello sguardo, (c) movimento e posizione, della testa e del corpo,(d) contatto delle mani, (e) configurazione delle mani, (f) movimento e posizione delle mani e delle braccia

Tra i non molti sistemi esistenti per rappresentare graficamente le LS vi è SignWriting (SW) di V. Sutton3, nato per raffigurare le posizioni ed i movimenti del corpo (in particolare nella danza) e poi applicato alle LS. E’ stato mostrato4 che esso rappresenta una valida soluzione in quanto consente sia la scrittura che la trascrizione di produzioni segnate, mantenendo le caratteristiche delle LS e permettendo una buona leggibilità dei testi così concepiti. Tale strumento può quindi essere utilizzato sia dai ricercatori a fini scientifici che dalla comunità sorda in generale.

Dal punto di vista del sistema grafico, SW è organizzato in 37 811 glifi (unità grafiche minime) che vengono disposti in una vignetta (spazio bidimensionale che rappresenta analogicamente lo spazio segnico tridimensionale) per comporre un segno [Fig. 1]. Ogni glifo rappresenta una componente manuale (configurazione, movimento, coordinazione, etc.) o non‑manuale (espressione del viso, movimento del corpo, etc.) del segno. E’ così possibile rappresentare sia le unità lessematiche5 che le strutture di grande iconicità6 sia segni isolati che segni inseriti in un discorso.

L’ostacolo maggiore incontrato da SW è la sua scarsa diffusione, dovuta in gran parte al numero esorbitante di glifi che lo compongono: tale quantità sarebbe, infatti, sufficiente a scoraggiare anche l’apprendente più volenteroso. E’ stato tuttavia dimostrato[4] che, una volta passata la diffidenza iniziale, è possibile – per soggetti segnanti ‑ cominciare ad utilizzare il sistema in poche ore, grazie ad una forte regolarità di questi glifi. In ogni caso, il numero considerevole di glifi pone problemi anche alla digitalizzazione delle produzioni in SW ed ad un loro riconoscimento automatico, il che si riflette negativamente sulla possibilità concreta di usare SW a scopo di ricerca, per esempio per analizzare il legame tra la forma di un segno ed i fenomeni linguistici.

Il lavoro qui proposto presenta una radicale riorganizzazione di SW (d’ora in poi chiamata SWricl1) per raggruppare i glifi secondo le loro caratteristiche comuni e per mettere in evidenza quelle regole implicite che permettono un suo facile apprendimento nonostante la quantità di glifi esistenti. A tale scopo si è provveduto a raccogliere i glifi sulla base della loro funzione (configurazione, movimento della mano, direzione dello sguardo…) per poi andare a individuare le caratteristiche che consentono di passare da un glifo prototipico (GP) ad un glifo variazione (GV). Ad esempio, per le configurazioni, sono stati individuati 242 GP e 4 regole di variazione con relativi set di possibilità (mano x 2 possibilità, piano x 2, lato x 3 e rotazione x 8) [Fig. 2]. I GP sono anche stati classificati in modo da evidenziarne le somiglianze, e così, imparando le 4 regole e circa una trentina dei 242 GP, è possibile sfruttare 23 232 GV ossia oltre la metà dei glifi esistenti. La facilità di apprendimento di SW dopo la riorganizzazione con SWricl1 è stata preliminarmente testata su un gruppo di studenti udenti di LS: i risultati sono incoraggianti in quanto, dopo appena 6 ore di formazione, i soggetti erano in grado di orientarsi facilmente all’interno di SWrecl1 (cosa non possibile con la vecchia classificazione) e di comporre e leggere brevi testi scritti in SW.

Ogni glifo prototipo che identifica una configurazione può, per trasformazione,dar vita a 96 glifi variazione basati sulla mano utilizzata et il suo orientamento

Oltre alle implicazioni nell’apprendimento di SW, SWrecl1 mira anche a favorire la sua informatizzazione, sia per permetterne un più facile utilizzo da parte degli utenti sordi e udenti, che per renderlo uno strumento utilizzabile nella ricerca linguistica. A tale scopo è nata la collaborazione tra gli autori ‑ un linguista e due informatici – con l’idea di cercare di risolvere, un passo alla volta, le difficoltà legate alla digitalizzazione del sistema grafico.

In primo luogo, è stato creato SWift (SignWriting Improved Fast Transcriber7), un editor di testi in SW, che permette attraverso una struttura ed un’interfaccia “deaf-centered” (ossia interamente pensata e realizzata in collaborazione con gli utenti sordi) di produrre testi in SW. In SWift l’utilizzo di SWrecl1 ha permesso di rendere più rapido, efficace e “user friendly” lo strumento di ricerca dei glifi che verranno usati dall’udente per comporre il proprio testo.

Nel corso delle loro ricerche su SW, gli autori hanno notato la tendenza degli utenti osservati a comporre prima a mano e poi a ricopiare al computer i testi: ciò ha portato alla necessità di implementare applicazioni di OGR (Optical Glyph Recognition), con caratteristiche diverse dal classico OCR (Optical Character Recognition) in quanto più vicine al riconoscimento di scritture di tipo ideografico. In effetti, OGR deve prendere in considerazione un numero molto elevato di glifi, organizzati in uno spazio grafico non lineare e diposti secondo regole di composizione non rigide. Una volta concluso il suo sviluppo, OGR effettuerà il riconoscimento basandosi esclusivamente sulle caratteristiche geometriche e topologiche dei glifi; si è pertanto resa necessaria ‑ in fase di progettazione ‑ una seconda fase di riclassificazione di SW (SWricl2) basata su queste caratteristiche.

Le applicazioni menzionate, basate su SWricl1 e SWricl2, dovrebbero permettere una facile digitalizzazione di documenti prodotti in SW, il che favorirà la diffusione del sistema grafico presso la comunità sorda. Tuttavia, ciò che preme ai linguisti che usano SW è che esso possa finalmente diventare uno strumento “utilizzabile” per fare analisi sulle forme della LS. La poca integrazione, fino ad oggi, tra SW ed i software di annotazione linguistica più comunemente usati implica, infatti, una seria difficoltà per sfruttare le potenzialità di SW come sistema di notazione delle LS. Integrando SW con ELAN, sarebbe possibile mettere in evidenza le relazioni tra significante e significato, le correlazioni tra forme del segno e strutture linguistiche, etc. ossia tra la notazione e l’annotazione delle LS.

Oltre alla sfida dell’integrazione informatica, si pone un duplice problema legato alla natura stessa di SW: visto il numero elevato di glifi e la scarsa standardizzazione di utilizzo del sistema grafico, è difficile realizzare trascrizioni che permettano poi un effettivo confronto sulle forme. Tale problema è però superabile grazie alla SWricl1 che ‑ mettendo in evidenza le caratteristiche intrinseche ai singoli glifi (caratteristiche trasversali a diversi GP) ‑ permette di collegare tra di loro realizzazioni grafiche diverse di forme segniche simili, o anche caratteristiche identiche in forme segniche diverse.

SWricl1 ed SWricl2 si pongono quindi così come primi passi per un’informatizzazione di SW che dovrebbe permettere lo sviluppo e la diffusione del sistema sia all’interno della comunità sorda che nell’ambito della ricerca linguistica sulla LS.

References
1. ELAN Team. 2002. ELAN - Electronic Linguistic ANnotator. Nijmegen (Netherlands), Max Planck Institute of Psycholinguistics. www.lat-mpi.eu/tools/elan/ [software, disponibile on line].

2. Kipp M. 2000. ANVIL. University of Applied Sciences, Augsburg. www.anvil software.de/index.html [software, disponibile on line].

3. Sutton V. 1995. Lessons in SignWriting: textbook & workbook. Deaf Action Committee for Sign Writing, La Jolla (CA).

4. Bianchini C.S. 2012. Analyse métalinguistique de l’émergence d’un système d’écriture des Langues des Signes: SignWriting et son application à la Langue des Signes Italienne (LIS). Tesi di dottorato, Université Paris VIII & Università degli Studi di Perugia, 512 p.

5. Cuxac C. & Antinoro Pizzuto E (2010). Émergence, norme et variation dans les langues des signes: vers une redéfinition notionnelle. in: Garcia B. , Derycke M. (eds) “Sourds et langues des signes: norme et variations”. Langage et société, 131: 37 53.

6. ELAN Team (2002). ELAN - Electronic Linguistic ANnotator. Nijmegen (Netherlands), Max Planck Institute of Psycholinguistics. www.lat-mpi.eu/tools/elan/ [software, disponibile on line].

7. Borgia F., Bianchini C.S., Dalle P. & De Marsico M. (2012). Resource production of written forms of Sign Languages by a user centered editor, SWift (SignWriting improved fast transcriber). Proc. VIII Int. Conf. LREC: 3779 3784.

If this content appears in violation of your intellectual property rights, or you see errors or omissions, please reach out to Scott B. Weingart to discuss removing or amending the materials.

Conference Info

Complete

ADHO - 2014
"Digital Cultural Empowerment"

Hosted at École Polytechnique Fédérale de Lausanne (EPFL), Université de Lausanne

Lausanne, Switzerland

July 7, 2014 - July 12, 2014

377 works by 898 authors indexed

XML available from https://github.com/elliewix/DHAnalysis (needs to replace plaintext)

Conference website: https://web.archive.org/web/20161227182033/https://dh2014.org/program/

Attendance: 750 delegates according to Nyhan 2016

Series: ADHO (9)

Organizers: ADHO