Sonidos

Los sonidos son la forma en que un lenguaje se vuelve real en el mundo físico, así que comenzaremos hablando de ellos. Algunas personas creen que una letra en su alfabeto es lo mismo que un sonido, o que todos los sonidos de todos los lenguajes del mundo son los mismos (que los sonidos de su propio lenguaje), sólo que con 'acentos' diferentes. Por qué esto es falso se puede explicar fácilmente y ser entendido por la mayor parte de la gente. Aquí no mezclaré sonido con representación o transliteración, y daré ejemplos de sonidos en lenguajes que pueden resultar familiares sólo para simplificar las cosas.

Sin embargo, tenemos que hablar primero de un tema bastante abstracto, para poder proseguir con confianza después. Hablaremos de fonos (sonidos reales) y fonemas (los sonidos en un lenguaje como los ve un lingüista).

Fonos y fonemas

El inmenso (de hecho, infinitamente denso) rango de sonidos posibles que un ser humano puede producir se llaman fonos. Cada posición particular de los labios, lengua y otras características de nuestro órganos fonadores puede pensarse como un punto en un continuo multidimensional. Dadas dos posiciones de la lengua con respecto al interior de la boca, siempre hay una posición en el medio, y así sucesivamente. Como los números reales en su recta.

Sin embargo, agrupamos los sonidos en torno a ejemplos prototípicos de ellos mismos, para estudiarlos mejor y más fácilmente, y llamamos a cada uno un fono, un sonido simple (es decir, único) que se puede describir por ciertas características (por ejemplo, la lengua toca los dientes, las cuerdas vocales vibran, etc.).

En un lenguaje dado, encontraremos muchos fonos, pero éstos no son el objeto de nuestro estudio. Necesitamos distinguir los sonidos que son distinguibles por los hablantes del lenguajes, es decir, los que éstos conceptualizan como diferentes. Éstos se llaman fonemas. Un fonema puede pensarse como una familia de sonidos relacionados que los hablantes consideran como una misma unidad fonética. Los sonidos que forman parte de un mismo fonema se llaman alófonos o variantes alofónicas.

En símbolos fonéticos, las transcripciones fonémicas se encierran entre barras (/X/), mientras que las fonéticas (aquéllas que distinguen los alófonos de un mismo fonema) se encierran entre corchetes ([X]). Los símbolos fonéticos estándar que usa la mayor parte de la gente hoy en día pertenecen a un conjunto, el IPA (International Phonetic Alphabet, "Alfabeto Fonético Internacional"). Son muchos, y necesitarías una fuente especial para verlos si los usara aquí, así que yo (como la mayoría de los que tienen que manejar símbolos del IPA en la Web o en e-mail) uso una transliteración que permite representar el IPA con caracteres ASCII de 7 bits, y que se llama X-SAMPA.

Hay varios otros tipos de transliteraciones del IPA en ASCII. Para oír los sonidos del IPA, podés usar un programa, IPAHelp.

De vuelta al tema... Los alófonos de un fonema no tienen por qué ser sonidos parecidos. Pueden serlo o no. Por ejemplo, en español el fonema /b/ tiene dos alófonos, [b] y [B] (una fricativa bilabial, parecida a la v del inglés, donde se sopla aire entre los labios). Éstos son sonidos similares y relacionados. Por otro lado, la /h/ japonesa tiene tres alófonos, [h], [C] (algo así como en huge en inglés, el Ich-Laut del alemán, o la j española ante /i/), y por último [p\] (como /f/, pero el aire soplado entre los labios, no entre labios y dientes). Éstos son sonidos bastante distintos entre sí. Lo que los hace alófonos es que los hablantes de japonés los tratan como el mismo sonido (fonema). Notemos que, por ejemplo, en alemán [C] y [h] son alófonos de distintos fonemas, así que pueden distinguir palabras.

Esto nos lleva a la principal característica de los alófonos: usualmente están en distribución complementaria. Esto significa que el alofóno dado de un fonema que aparece en una posición particular depende de esa posición, la cual determina cuál fonema (uno y no otros) aparecerá. Volviendo a los ejemplos, en español /b/ es [b] después de /m/ y cuando comienza una palabra claramente (por ejemplo, al principio de una oración); de otra forma es [B]. No se puede tener [mB] o [ab], ya que solamente [mb] y [aB] son posibles.

Esto se reduce al hecho que define qué son los fonemas: sonidos que pueden distinguir palabras. Si dos sonidos son alófonos, no pueden producirse dos palabras (distintas) intercambiándolos, porque de hecho son lo mismo; si pronunciás uno donde debería aparecer otro, sonará extraño o incorrecto a los hablantes nativos, pero probablemente no oirán una palabra diferente.

Vas a ver más de esto después, en otras secciones, ya que seguiré repitiéndome. Si no entendés el concepto de fonema, es mejor que sigas tratando.

Vocales y consonantes

Los sonidos usados en cualquier lenguaje se pueden dividir (generalmente) en consonantes y vocales. Esta división no es necesariamente univeral; en muchos lenguajes algunas 'consonantes' como r, m, n, l, sirven de hecho como vocales (es decir, se las trata como núcleos de sílaba, pueden ser acentuadas or alargadas, etc.). Por ejemplo, el sánscrito tiene l y r silábicas; y la n japonesa de final de sílaba es moraica (se pronuncia con longitud similar a una vocal, e influye en la métrica). La división entre vocales y consonantes es un asunto de cierre: cuanto más cerrados están los pasajes respiratorios, más consonántico es un sonido. Vamos a examinar los diferentes tipos de sonidos usando esta escala.

Consonantes

Los sonidos varían a lo largo de dimensiones. Éstas representan rangos de características posibles, o características binarias (de tipo sí/no). Cada lenguaje tiene una fonología con una o más dimensiones dentro de las cuales se encuentran y reconocen sonidos. Una dimensión importante es el grado de cierre (u oclusión). De acuerdo a esto, las consonantes se clasifican en:

Además, una africada es una oclusiva más una fricativa, que ocurren en el mismo punto de articulación, como la ch española (que es /tS/, donde /S/ = sh), o la z alemana (que se pronuncia /ts/).

Un click es un sonido producido colocando la lengua en posición para una oclusiva, mientras hay un segundo cierre del paso de aire en otro lugar (generalmente el velo del paladar, donde se pronuncia /k/), acumulando presión y luego soltando el aire (ver abajo).

También tenemos el punto de articulación, es decir, dónde ocurre la obstrucción del flujo de aire. De acuerdo a esto, las consonantes pueden ser:

Algunas otras dimensiones son:

Examinemos ahora estos contrastes. Los llamo contrastes porque eso es lo que son: cosas que pueden ser distinguidas. La lingüística se basa en contrastes, en diferencias. Si un lenguaje no distingue entre dos sonidos, entonces, para todos los propósitos prácticos, es el mismo sonido, y como tal debe ser estudiado.

La voz (vibración o no de las cuerdas vocales) es un contraste muy común en los lenguajes occidentales indoeuropeos, aunque no en muchas otras familias lingüísticas, donde esta distinción no se hace (de manera que, por ejemplo, /p/ y /b/, o /t/ y /d/, son el mismo fonema).

La nasalización es un contraste muy común. Las nasales más comunes son a su vez oclusivas sonoras, pero algunos lenguajes (como el galés) tienen nasales sordas, y unos pocos tienen nasales fricativas. Si no te imaginás como pronunciar una nasal sorda, tené en cuenta que una m es similar a una b nasalizada (la diferencia es mínima), de manera que una m sorda es casi como una p nasalizada: pronunciá una p al mismo tiempo que dejás salir aire por la nariz, y listo. Mucha gente de hecho nasaliza las consonantes (y las vocales) después de una nasal, aunque no se dan cuenta: la distinción generalmente no es fonémica (no se puede usar para distinguir una palabra de otra).

Ya hablamos de la aspiración. Un lenguaje puede tener oclusivas aspiradas, no aspiradas, o ambas; y puede hacer fonémica esa distinción (como el hindi) o sólo fonética (como el inglés).

La palatalización es un fenómeno bastante común entre los lenguajes. Una consonante se palataliza elevando la parte media de la lengua hacia la parte superior de la boca (el paladar). Normalmente la consonante palatalizada tiene una contrapartida alveolar. El resultado es algo que suena como la consonante alveolar correspondiente más un sonido /j/ (como la i en 'tiene' o, en España, la y de 'yo'). El ruso tiene una serie de consonantes palatalizadas, transliteradas con un apóstrofe (t', l', d'). El español (peninsular) tiene dos, ll (en IPA, /L/) y ñ (/J/); el francés tiene también éste último, escrito gn, y el portugués tiene lh, nh.

La glotalización se hace cerrando la glotis (el órgano que impide que la comida vaya a los pulmones y el aire al estómago, cuando se cierra a tiempo), y abriéndola al mismo tiempo que se pronuncia el sonido. Los sonidos glotalizados son generalmente oclusivas, y se las llama también eyectivas. Se puede crear una glotalización produciendo un glottal stop (oclusiva glótica) al mismo tiempo (en coarticulación) que la oclusiva principal, y luego liberando ambos cierres al mismo tiempo. Pero ¿qué es un glottal stop? Al comenzar una palabra en vocal, y si no hay nada antes, solemos producir uno antes de la vocal, aunque no nos damos cuenta. También cuando queremos separar dos vocales, haciendo una pausa entre ellas. Al aclararnos la garganta dos veces, generalmente hay un glottal stop entre ellas. En alemán, siempre hay un glottal stop antes de una vocal inicial. Este sonido no es fonémico en alemán o en español, pero es bastante común en otros lenguajes, generalmente transliterado como un apóstrofe (como en hawaiiano o klingon), o con su símbolo IPA, similar a un signo de interrogación sin punto (transliterado /?/). El georgiano y el quechua tienen sendas series completas de oclusivas sordas glotalizadas o eyectivas, que también se llaman glotálicas egresivas.

También hay consonantes glotálicas ingresivas, o implosivas. Para producir una implosiva, hay que crear, además de una aproximación o clausura en otro punto, una clausura o cierre en la glotis, luego bajar la glotis, y al alcanzarse una cierta presión soltar ambos cierres. Algunos lenguajes africanos, entre otros, tienen consonantes implosivas, que son usualmente oclusivas sonoras. Mi lenguaje construido g'amah tiene oclusivas implosivas y nasales implosivas.

Algunos otros contrastes que no mencioné hasta ahora:

Una consonante lateral es una en la que la lengua mantiene cerrado el paso de aire en la parte central de la boca, pero dejando que fluya aire por los costados. La lateral más común que conocemos es /l/, que usualmente indica un sonido alveolar y sonoro. Sin embargo, el inglés tiene dos variantes, una alveolar y otra velar [L\]; ésta última (llamada dark L o 'L oscura') es la que le da ese sonido extraño a la l en palabras como milk, sell, etc. Esta l velar es más parecida a una g que a otra cosa. Ambas variantes, al igual que nuestra l, son sonoras, pero algunos lenguajes, como el galés, tienen una l sorda y fricativa (que se escribe /K/, y se parece a una mezcla entre /l/ y /s/).

Una consonante retrofleja se produce doblando la lengua hacia atrás dentro de la boca, hasta que toque el paladar con la punta de la cara inferior. La retroflexión existe y es fonémica en muchos lenguajes. Las retroflejas también se llaman apico-palatales (lo cual significa que el ápice, o sea la punta de la lengua, toca el paladar). No hay ejemplos conocidos (para nosotros) de retroflejas, excepto la r de muchos dialectos del inglés norteamericano. En sánscrito hay una serie completa de consonantes retroflejas que van paralelas a las alveolares, y se transliteran como t, d, s, etc., con un punto debajo.

Si sólo se usan las dos dimensiones principales (grado de cierre y punto de articulación) y se simplifican algunos puntos de articulación, puede mostrarse la distribución de las consonantes del español rioplatense en una grilla como ésta:


             labial  lab-dnt   dental  alv   alv-pal  velar

oclusivas      p b              t d                   k g
fricativas             f               s      S       x
africadas                                     tS
aproximantes                           4 l r
nasales          m                       n    J

Nótese que /S/ representa el sonido tanto de ll como de la y consonántica, ya que ambas consonantes se funden en una en este dialecto, y su articulación varía entre la postalveolar a la francamente palatal. Esta tabla es válida, sin estas consideraciones, para todos los otros dialectos del castellano.

Nuevas consonantes

¿Cómo inventar nuevas consonantes para tu lenguaje? El primer paso debería ser decidir qué contrastes vas a usar. El español tiene tres puntos de articulación (PdAs) para las oclusivas, que son normalmente el marco de referencia, y distingue voz para las oclusivas (no para las fricativas) y nasalización.

Lo más importante es notar que la fonología de un lenguaje es un sistema. Las consonantes que estén fuera del sistema (porque, por ejemplo, usan contrastes excepcionales) tienden a perderse y desaparecer, o se funden con otras similares. Por ejemplo, el español no podría tener una eyectiva (glotalizada) porque usaría un contraste que no se encuentra en ningún otro punto del lenguaje, y no sobreviviría mucho tiempo. Las excepciones (como la presencia de /tS/, el sonido ch, que es la única africada) son posibles, pero no deberías abusar de ellas. Si tenés un sonido exótico, deberías tener otros del mismo tipo. Por otra parte, probablemente no deberías inventar muchos sonidos extraños; tenés que saber cómo pronunciar cada uno de ellos, y ser capaz de leer tu lenguaje fluidamente. (Esto también involucra una planificación cuidadosa del esquema de transliteración.)

Una vez decididos los contrastes que vas a usar, armá la grilla y llená los huecos. Probablemente tengas que inventar nuevos símbolos o digrafos para algunas letras (ver Cómo escribir). Si te parece que hay muchas consonantes, borrá una serie, o algunos miembros. No hay obligación de ocupar todos los lugares de la grilla (el español, como habrás visto, deja muchos espacios vacíos). Por ejemplo, podés tener oclusivas sordas y sonoras, pero solamente fricativas sordas y nasales sonoras, y no tener africadas.

El español tiene sólo una africada, ch /tS/; en cambio, tu lenguaje podría tener africadas en todas las posiciones donde haya una oclusiva y una fricativa. Por ejemplo, las consonantes pf (que se encuentra en alemán, como en Pferd), ts (también en alemán, escrita z como en zehn, y en japonés, como en tsukuru, aunque sólo es una variante alofónica de /t/), tth /tT/ (donde /T/ es la th sorda del inglés, o la z dental del español de Castilla), tsh (ch), kkh (como sonarían kj simultáneas en español), etc.

Puede completarse una serie de consonantes, por ejemplo las nasales españolas: no hay nasal velar (no hay razón para que la haya, pero tampoco para que no). Una nasal velar es el sonido del grupo final escrito ng en inglés). También podría completarse la serie de las oclusivas para que hubiera una palatal que se correspondiera con la nasal ñ (/J/), etc.

Para meterte de lleno en la cosa, podrías añadir un contraste no usado en español, y crear una serie de consonantes palatalizadas. O usar la aspiración como distinción fonética, o lateralizar o retroflexionar consonantes. Como dice Mark Rosenfelder, la clave de un lenguaje naturalista es añadir (o sustraer) dimensiones. Estudiante de quechua, menciona él que este lenguaje no tiene una o dos, sino tres series de oclusivas: aspiradas, no aspiradas, y glotalizadas; pero no distingue entre consonantes sordas y sonoras. De manera que para un hablante de quechua la p de peso y la b de beso son el mismo sonido (fonema), y las dos palabras suenan como lo mismo.

Algunos sonidos son más comunes que otros. De acuerdo a las fuentes de Mark Rosenfelder, la mayoría de los lenguajes tienen las oclusivas simples /p t k/. Por lo que he podido averiguar, los sistemas fonológicos más simples corresponden al hawaiano, con ocho consonantes y cinco vocales, y el rotokas, con sólo seis consonantes y cinco vocales. El quechua tiene muchas consonantes pero sólo tres vocales (/a i u/, que son las más comunes). El sistema más complejo parece ser el del !xu~ (o !kung), lengua de la familia khoisan de África, con 92 consonantes (47 de las cuales son clicks).

Vocales

Las vocales se producen exactamente igual que las consonantes; no son diferentes esencialmente de ellas. Pero el detalle principal es que el flujo de aire prácticamente no es molestado de ninguna forma al pasar por la boca; sólo es modulado por la posición de la lengua y otras partes de los órganos del habla. Además, las vocales son normalmente sonoras (algunos lenguajes tienen vocales sordas, especialmente al final de las palabras; suenan como pronunciar una h inglesa con la lengua, labios, etc. en la misma posición que para la vocal).

Las vocales varían a lo largo de las siguientes dimensiones:

El español tiene este sistema vocálico:

         front centr post

altas    i               u

medias       e       o

bajas            a

Este diagrama en forma de triángulo es recurrente, y se encuentra en todos los libros de fonética; usa las dos dimensiones principales (altura y frontalidad). Puede pensarse el triángulo como un diagrama del interior de la boca, donde los dientes (la parte frontal) están a la izquierda. Dentro del triángulo puede haber vocales en cualquier lugar. Los sonidos centrales y medios, como la schwa inglesa (/@/), son los menos distinguibles y marcados; la schwa está justo en el centro del triángulo, sobre la /a/. En ruso hay una vocal central alta /i\/ (en cirílico ы), que se encuentra también sobre la /a/, pero más arriba, en el medio de la línea i—u.

Nuevas vocales

Como ocurre con las consonantes, podés inventar tantas vocales como quieras. Tendrías que tener en cuenta que las vocales forman un sistema, uno que no debe estar desbalanceado. Si hay una versión tensa y una laxa de i, es porque estás usando la tensión como contraste, y debería estar presente en algún otro par de vocales.

El redondeamiento, aunque así lo parece, no está desbalanceado en español. Parece ser que el redondeamiento es más frecuente en las vocales posteriores que en las anteriores. Sin embargo, muchos lenguajes tienen frontales redondeadas, que el español no tiene (el alemán y el francés tienen ambos formas redondeadas de i y e, escritas ü y ö en alemán). Por otro lado, podés usar vocales posteriores no redondeadas (como la u japonesa).

Puede haber tantas vocales como quieras. Los sistemas más simples tienen tres, generalmente /i a u/ (los vértices del triángulo, y no por casualidad). Esto significa que distinguen tres sonidos vocálicos, no que sus hablantes no puedan o sepan pronunciar una [e] o una [o]. Un hablante de quechua puede decir algo que suena como [e] a un hablante español, pero que es de hecho una /i/, de la cual el sonido [e] es una mera variante alofónica.

El español y el japonés tienen cinco vocales, /i e a o u/. El inglés británico estándar tiene doce vocales, el alemán catorce, y el sueco alrededor de diecicho. Pero no hace falta que llegues a tanto.

Hay al menos dos lenguajes naturales con sólo dos vocales, el abkhazio y el abaza, hablado en el Cáucaso Noroccidental, a los cuales podría sumarse otro del mismo origen, el ubykh, si no fuera porque se supone extinto. Estas vocales probablemente podrían caracterizarse como /a/ e /i/, donde /i/ tendría como variantes [i], [u] y quizá cualquier otro sonido alto, sea frontal, central o posterior, redondeado o no.