Escribiendo tu lenguaje

Una vez determinados los sonidos que va a usar tu lenguaje, vas a necesitar una forma de escribirlos (transliterarlos) en el alfabeto latino, y quizá un alfabeto propio. En un momento hablaremos de alfabetos.

La transliteración puede ser una pesadilla. Lo ideal sería tener un símbolo para cada sonido, pero el alfabeto latino no tiene símbolos para representar algunos sonidos muy comunes. Aquí está la primera elección que tenés que hacer: ¿vas a inventar o usar un símbolo para cada sonido, o vas a usar alguna otra manera?

Si querés un símbolo para cada sonido, probablemente vayas a tener que usar símbolos que no son letras (como ' @ ? !) o recurrir a marcas diacríticas, es decir modificar letras usando pequeños signos encima (o debajo) de ellas. Los acentos y diéresis sobre las vocales son marcas diacríticas: á è î ÿ. El español muestra alguna de sus vocales acentuadas con un acento agudo: acá éramos ínfimos órganos súbitos, y escribe el sonido nasal palatal como ñ. El inglés, por otra parte, no usa diacríticos (pero su ortografía es impredecible y atroz). El francés usa acentos para mostrar que una e debe pronunciarse, y por tradición, en muchas palabras: été âme à mère; y tiene una letra ç (cedilla) para representar /s/ antes de a, o, u. El portugués muestra las vocales nasales con una tilde(~) sobre ellas (como en são). De hecho, esta tilde es del mismo origen que la que va sobre ñ; se trata de una N estirada y estilizada por el uso. El alemán escribe las versiones frontales de las vocales con una diéresis (ä ö ü). El danés escribe una especie de a redondeada con å, y una o frontal con ø. Muchos lenguajes tienen letras no estándar para ciertos sonidos, y a menos que hablés uno de ellos y tu teclado esté configurado para ellos, no vas a poder acceder a ellas fácilmente al escribir tu lenguaje en tu computadora.

Si no querés tantos símbolos extraños, probablemente vas a tener que usar dos o más símbolos (formando símbolos compuestos) para representar algunos sonidos, tal como el español usa rr y ch para sonidos individuales. Éstos se llaman digrafos (los trigrafos, aunque posibles, deberían evitarse por su longitud). La letra h es generalmente útil para hacer digrafos. Pero hay que tener en cuenta algo: dos símbolos nunca deberían usarse para hacer un digrafo si pueden aparecer solos para representar dos sonidos distintos. El español puede usar ch porque h no tiene sonido asignado y ch no se usa nunca para el mismo sonido que c (de los dos que tiene); podemos escribir ll porque no hay combinaciones /ll/ en nuestra fonología. En cambio, no podríamos usar ls para representar una fricativa lateral, porque ls representa dos sonidos, /l/ + /s/.

La transliteración no tiene reglas sobre cuáles símbolos hay que usar para representar tal sonido, pero tendrías que tratar de hacer legible el lenguaje: está bien usar zh para representar /f/, pero la mayoría de la gente seguramente leerá algo completamente distinto de /f/ cuando se encuentren con este digrafo, y además, ya tenemos un símbolo más familiar, f, para llenar este espacio, ¿verdad?

La transliteración debería ser tan fonémica como sea posible. El español y el italiano son bastante fonémicos, y en cuanto al español en particular, es muy importante el hecho de que se puede leer una palabra y saber siempre cómo se va a pronunciar. Por el contrario, el inglés tiene una ortografía arcaica, donde las palabras se escriben como sonaban hace siglos, aunque en cierta medida se puede adivinar el sonido de muchas. Lo mismo o peor se puede decir del francés (Ferdinand de Saussure cita como ejemplo la palabra oiseau, que se pronuncia /wa'zo/, de manera que no hay un solo sonido que se corresponda con una letra 'apropiada'). El tibetano escrito es aún peor; el lenguaje escrito ha permanecido casi incambiado desde el siglo VII d. C. En cambio, otros lenguajes (como el ruso) son muy consistentes en cuanto a la concordancia entre lo escrito y lo fonético.

Desde luego puede haber utilidad en utilizar una ortografía arcaica. El inglés tiene muchos dialectos, y si se intentara representarlo fonéticamente sin ambigüedad, se lograría una representación adecuada para algunos pocos dialectos pero incorrecta para otros; así, la forma escrita permite una intercomunicación entre los dialectos (cada uno de los cuales pronuncia distinta una misma palabra escrita). Lo mismo vale para el tibetano, que además es una lengua sagrada (en la que están transcriptas antiquísimas escrituras), por lo cual es interesante y útil conocer la etimología y forma precisa de las palabras antiguas, preservada en la ortografía. Cualquiera de estos motivos, y otros, pueden utilizarse para "justificar" ficcionalmente una ortografía a primera vista complicada y contraintuitiva para un lenguaje construido, si su creador tiene ganas de hacerlo.

Alfabetos y otras escrituras

Un alfabeto es una colección de símbolos que representan sonidos. Si querés poder inventar uno para tu lenguaje. Si lo hacés, y tu ortografía romanizada es fonémica, tu alfabeto debería serlo también: un símbolo para cada sonido. También podés usar digrafos y añadir diacríticos. Si tu lenguaje deriva de otro lenguaje para el cual ya tenías un alfabeto, probablemente el lenguaje más joven use el alfabeto viejo, pero algunas letras habrán cambiado de sonido. Por ejemplo, el español usa el alfabeto latino, pero la letra c (que en latín era siempre /k/) ahora representa /s/ frente a e, i. Esto no es fonémico, pero es completamente regular.

Al inventar letras, jugá un poco con ellas y escribílas rápidamente una después de otra. La gente en la mayoría de los casos escribe sin cuidado, y las letras muy elaboradas probablemente serán simplificadas. También tenés que tratar de hacer que cada letra se distinga bien de las otras, para que no se las confunda. El punto sobre la i apareció cuando el palito de la i minúscula comenzó a confundirse con las líneas verticales de las m y n en la escritura gótica. Algunas fuentes de computadoras y los programadores distinguen 0 (cero) y O (la letra o mayúscula) escribiendo una barra sobre el cero.

Tenés que decidir también cómo vas a escribir y leer. ¿Será de izquierda a derecha, como en el alfabeto latino y el cirílico? El hebreo y el árabe se escriben de derecha a izquierda, y las vocales no se escriben excepto en los libros para niños y (el árabe) en el Corán. El japonés se escribe tradicionalmente (en novelas y manga) de arriba a abajo y de derecha a izquierda, pero en ciertos libros (de texto, como los de matemáticas) se escribe a la manera occidental, en líneas de izquierda a derecha. Los japoneses leen intercambiablemente en un sentido u otro.

Ideogramas, silabarios, etc.

Los alfabetos no son la única manera de escribir. El chino usa ideogramas, o caracteres que solían representar un dibujo de un objeto. Cada carácter se lee como una sílaba; pero palabras que suenan igual y no tienen relación se escriben como caracteres distintos. Los caracteres chinos (hanzi) tienen cada uno dos partes, el radical y la fonética. El radical da una idea del significado, y la fonética daban una idea del sonido (caracteres con la misma fonética representaban sílabas que rimaban, hace milenios). Un radical puede actuar a veces como fonética y viceversa. Muchas veces la relación entre el significado original y el actual es sumamente tortuosa, o su sentido se ha perdido en el tiempo.

El japonés usa un sistema mixto de kanji (ideogramas, tomados de los chinos) y kana (caracteres silábicos fonéticos). En general, el contenido principal de lo que uno dice (las raíces de las palabras) se escribe en kanji, mientras que las partículas, conjugaciones y terminaciones se escriben en kana. Hay unos 90 kana divididos en dos conjuntos equivalentes (hiragana y katakana). Se usan normalmente hiragana para las palabras japonesas originales; se prefieren katakana para las palabras prestadas o inventadas, y también para añadir énfasis, como la cursiva en el alfabeto latino. Cuando se usa un kanji inusual, se puede clarificar escribiéndolo fonéticamente en hiragana (que se llaman en este caso furigana). En un kana se puede cambiar la calidad de la consonante usando algunas marcas diacríticas. Hay 1945 kanji estándar, de los cuales 1006 se enseñan en la escuela primaria, y cada kanji se puede leer de acuerdo a su pronunciación japonesa (kun-yomi) o a su pronunciación china original (on-yomi). Como si no fuese complicado ya, cada kanji suele tener varias lecturas para cada forma.

El coreano usa un alfabeto llamado hangul que es un código característico (featural code), un sistema en el cual sonidos similares se representan con símbolos parecidos. La tradición dice que fue inventado por un rey. En cualquier caso, requiere un notable análisis fonético. En hangul, los símbolos se agrupan en sílabas, haciendo que la escritura parezca como si consistiese de muchos ideogramas o caracteres silábicos, el cual no es el caso.

El árabe usa una escritura cursiva, lo cual es raro porque la mayoría de los pueblos históricamente han comenzado con letras de bloque aisladas, debido a la naturaleza del soporte material de su escritura (piedra, arcilla o madera). El árabe, imagino, comenzó desde el principio a ser escrito con pinceles finos sobre alguna superficie lisa; las letras cursivas son completamente inadecuadas para esculpirlas rápidamente en piedra o arcilla. En árabe y en hebreo no se escriben las vocales (excepto las vocales largas en árabe), sino sólo las consonantes, debiéndose interpolar las vocales según el contexto; este tipo de sistema se llama abjad.

El tailandés, aunque de raíces monosilábicas, usa un alfabeto fonético de letras únicas, que frecuentemente tienen pequeños bucles y torceduras en los extremos. Algunas otras escrituras de pueblos de ese área geográfica también usan este tipo de caracteres que parecen un poco demasiado elaboradas. La razón es que fueron pensados para escribirse usando materiales que requerían que las líneas fueran 'cerradas' de alguna forma.

Muchas lenguas de la India se escriben con un silabario llamado devanagari, el cual funciona así: el símbolo básico representa una sílaba con la vocal a (pa, ta, sa, ra, etc.). Por medio de signos diacríticos se puede cambiar la vocal por otra. Si se requiere la consonante sola, se utiliza otro signo diacrítico, el "matavocales", que se llama virama. El sistema base, con signos que implican una "vocal inherente", lleva el nombre genérico de abugida.

Todo esto se reduce a un principio: para inventar un alfabeto, tenés que saber sobre qué se va a escribir y por qué medios.

Inventar un alfabeto es simple, pero un silabario (o ideogramas) puede ser un dolor de cabeza, así que tendrías que meditarlo cuidadosamente antes. Los ideogramas son probablemente la peor forma de escritura (en términos de practicidad), y probablemente no deberías usarlos a menos que tengas memoria fotográfica. Los silabarios están muy bien, pero funcionan mejor en lenguajes muy restringidos; el español, por ejemplo, tiene un número bastante grande de sílabas posibles, e inventar un signo para cada una sería casi imposible.

Si te parece, echále una mirada a algunas escrituras de lenguajes naturales en Ancient Scripts [en inglés], una página con ejemplos de todo el mundo.

El orden del sistema de escritura

Estamos acostumbrados a tener las letras en orden. Esto es muy útil para diccionarios y guías de abonados telefónicos, y para los índices en generales. ¿Cómo vas a ordenar tus símbolos?

Los alfabetos occidentales derivados del alfabeto latino usualmente siguen un orden predecible. El inglés, que es probablemente el más reducido y simple de todos, usa un conjunto pequeño de símbolos, y los digrafos no se consideran símbolos independientes; pero esto no es así en otros lenguajes. Por ejemplo:

Algunos otros lenguajes, que usan escrituras no latinas, ordenan sus caracteres de forma distinta. Algunos usan las características fonéticas de los sonidos para ordenar las letras; por ejemplo, primero los labiales (p, b, m, f), luego los alveolares (t, d, n, s) y así.

En cuanto a los silabarios, también hay generalmente un orden fijo. En japonés, ambos tipos de kana se disponen así: primero las vocales, a i u e o, luego las sílabas que comienzan con k (ka, ki, ku, ke, ko), luego t-, n-, h-, m-, y-, r-, w-, y finalmente el símbolo para la n silábica. Otro orden, más tradicional, se usaba en tiempos antiguos (y todavía se usa en índices y tablas, por oposición al moderno, que se usa en diccionarios). Este orden sigue el de un poema del monje budista Kuukai, que usa cada carácter hiragana exactamente una vez:

Iro ha nihohe to
chirinuru wo
waka yo tare so.
Tsune naramu
uwi no okuyama
kefu koete
asaki yume
mishi wehi mo sesu.

(Nota: esto probablemente no es japonés moderno correcto, ni ésta es la pronunciación correcta. El kana de ha, donde aparece aquí, se pronuncia wa, y los de wi y we son obsoletos. El de wo se pronuncia o.)

En cuanto a los ideogramas, los kanji japoneses (y los hanzi chinos) se ordenan por número de radical y, dentro del mismo radical, por el número de trazos que se usan para escribirlos (hay un método para contarlos apropiadamente).

Sería una buena idea tener letras con nombres que signifiquen algo, o que puedan ser recitadas en orden. Las letras latinas tienen nombres sin sentido en todos los lenguajes que las usan, y esos nombres son muy similares entre sí; de ahí la necesidad de códigos como 'Alpha, Bravo, Charlie'... Otros lenguajes y escrituras no tienen este problema.