Синтезаторът на българска реч ГЛАС
от Тодор "Тош" Арнаудов

VOICE - Bulgarian text to speech engine
Created by Todor "Tosh" Arnaudov

6.4.2005

Бе обнародван Езикотворец-8, който използва Глас 07.05.2004.

12.5.2004 (обновено 1.7.2004)

Излезе "ГЛАС 07.05.2004" (ГОВОРЕЩ ПИСАР 0.15)!

  • Прочети ръководството на "Глас 07.05.2004"
  • Прочети за устройството на синтезатора на реч "Глас" от geocities

    Изследванията на Тодор Арнаудов и Twenkid Research - http://artificial-mind.blogspot.com

     
         

     
     


    Гласови данни на "Глас" 07.05.2004:
  • Променлива скорост чрез промяна на продължителността на гласните и звучните съгласни.
  • Плавни звукови преходи между гласни и звучни съгласни и "извиване" на гласа чрез променлива продължителност на преходите между гласни и звучни съгласни.
  • Променлив тембър чрез променлива честота на гласните и звучните съгласни.

    Първична обработка на текста:

  • Замяна на едни низове с други (експериментално изпълнение; засега само 0->нула, 1->едно, 2->две, 3->три...; г. - година, т.е. - тоест)
  • Различаване на меко и твърдо "л" ("леле" => "л2ел2е"; България => България)
  • Различаване на "къси" и "дълги" съгласни в краищата на думи.
  • Обеззвучаване на звучни съгласни.
  • Ударени и редуцирани гласни (виж по-долу "Специални възможности")

    Няколко ранни записа, породени от предварителна версия на "Глас" (29.4.2004). Не показва пълните възможности за настройка на звука.

  • Виж предпремиерни технически данни за "Глас"

    Изтегли "Глас 07.05.2004" (RAR - 150 KB, ZIP - 170 KB)

  • http://www.oocities.org/todprog/bgr/sval.htm
  • http://www.oocities.org/eimworld/glas-07052004.zip
  • http://bgit.net/file.php?id=66795

    1.7.2004

    За тези, които са посещавали по-рано: последната кръпка (4.6.2004) е вмъкната в пакета за сваляне.

    4.6.2004

    Кръпката е обновена отново. Адресът е същият: pisar_glas_krupka.zip (30 KB)

    Начинът по който работи частта, обработваща текста, водеше до това, че изречения, завършващи на думи, завършващи с буквата "г" и с точка, се изговаряха като "г." се замени с "година".

    Например: "В този миг." се изговаря "В този мигодина".

    При сегашния начин на работа на Глас, поправката на този случай е или да се изтрие съкращението "г." от "nizove.dll" (обновен е в кръпката), или да се изключи замяната на низове: единицата в реда от "osnova_glas.txt":

    "1 nizove.dll"

    да се смени с "0". По този начин обаче няма да се изговарят и цифрите.

    1.6.2004

    Нова корекция в изпълнимия файл. Леко е променен моделът за "вдишване". Досега Глас пораждаше звук на порции (изкази), като краят на изказ е първия интервал или точка след като са се натрупали зададен брой значи.

    Интервалът беше изключен, защото така, тъй като интервалът се среща по-често от точка, по време на синтезирането се получават паузи на неподходящи места.

    Сега изказът може да свърши при среща на точка, запетая, точка и запетая, въпросителна, удивителна, лява и дясна скоба.

    Адресът на кръпката е: pisar_glas_krupka.zip (30 KB)

    Благодаря на Александър Иванов, който ме накара да обърна внимание на този въпрос.

    27.5.2004

    Чували ли сте за българския синтезатор на реч за Windows с отворен код "Reader" от Иван Иванов, създаден точно преди една година? Иван е разработил машината експериментално, с цел да насърчи някой да се заеме с усъвършенстване на сътвореното.

    За жалост той е използвал класическия подход със слепване на записи на изговор на цели фонеми, който е изоставен в "Глас", така че аз лично не мога да надстроя труда на Иван.

    И без ефекти обаче "Reader" звучи много добре, и има удивително удобни средства за записване на нови гласове, ако искате да си направите машина, говореща с вашия глас. Препоръчвам ви да чуете "Reader" и да си поиграете с него:
    Reader: http://tts.data.bg/

    26.5.2004

    Нова версия на свитъка с фонемите. Поправя грешката при включени "късидълги" съгласни "с." да се изговаря "сдве." Кръпките по-долу са обновени.

    20.5.2004

    Поправена грешка, свързана с къси и дълги шумови съгласни и сменен шрифт на българските диалози (MS Sans Serif вместо Arial). Изтегли нов изпълним файл, fonemi0.dll и osnova_glas.txt: pisar_glas_krupka.zip (30 KB)

    Открита грешка при изговор на "й" + специална гласна о (о2, о3, о4) - изговаря се "йо" и след това цифрата. За да се поправи, отворете "fonemi0.dll" с текстов редактор и изтрийте редовете с "йо" и "ьо"; или изтеглете файла: fonemi0.zip (< 1 KB) и го запишете в папката на "Глас" върху стария.

    12.5.2004

    Излезе "ГЛАС 07.05.2004" (ГОВОРЕЩ ПИСАР 0.15)!

    Прочети ръководството на "Глас 07.05.2004"
    Прочети за синтезатора на реч "Глас"

    Изтегли "Глас 07.05.2004" (RAR - 150 KB, ZIP - 170 KB)

  • http://www.oocities.org/todprog/bgr/sval.htm
  • http://www.oocities.org/eimworld/glas-07052004.zip
  • http://bgit.net/file.php?id=66795
    Ако програма изговаря паразитни звуци, отворете:
    "osnova_glas.txt" и го променте така:
    
    1 leleta.dll
    0 kusidulgi.dll
    0 slivane.dll
    1 bezzvuk.dll
    1 nizove.dll
    
    




    25.4.2004
    Очаквайте говорещата машина на Тош "Глас"

    http://bgit.net/?id=66387

    "Предпремиера" на синтезатора на реч "Глас"

    Новина | Автор Тодор Арнаудов | 25 Април 2004 @ 00:32 EET | 0 Прочита | 0

    Като на шега за около десет дни в началото на този месец си направих звуков синтезатор, който нарекох "Глас".

    Исках да осъществя една своя стара "детска мечта", да се появя "на пазара" със своя говореща на български програма /някой знае ли дали може да се спечелят пари от такова нещо?/; и да направя що-годе читава говореща част на СЛОГ, - Система за лингвистично осигуряване на говора - разработка на изследователи от Пловдивския университет.

    СЛОГ е мощно нещо, от гледна точка на езиковедското осигуряване, - разполага с речник на ударенията и с морфологичен анализатор, също разработка на ПУ (може да сте чули СЛОГ на Пловдивския панаир миналата година) - но говорещата част на системата звучи дразнещо, въпреки че държи сметка на ударения, редукции на гласни под влияние на ударения и каква част на речта е изговаряната дума, тъй като тя, както при останалите досегашни български говорещи програми за PC (не знам за тази на Борислав Захариев), използва най-прекия начин за слепване на записи, който не държи сметка на това какво представлява звукът в същността си; както знаете, не звуците са съставени от фонеми, а фонемите са съставени от звуци (по този въпрос очаквайте статия).

    ...

    "Глас" е стегнат (към днешна дата 1600-1700 реда глаголи, макар че има още с какво да се "пълни") и модулен; програмата, към която е прикачен, може да го накара да говори с няколко реда код:

    CGlas Govor;
    Govor.Get_Record_Memory();
    Govor.Play_Osnova("osnova.txt");
    
    //////////////
    
    CGlas Govor;
    Govor.Get_Record_Memory();
    Govor.Zaredi_Glas("osnova.txt");
    Govor.Say_String("Нещо, което трябва да се изговори...");
    Govor.Free_Recorder_Memory();
    

    Машината се основава на създаден модел на гласни струни, макар все още опростени. Това позволи да се получи сносна говореща машина за "нула време".

    Гласните струни на "Глас" дават възможност гласът да се разтяга във времето, да се извива, плавно да преминава от един звук в друг и върху гласът да бъдат прилагани звукови ефекти.

    Можете да чуете няколко примера:

    http://www.oocities.org/todprog/glasdemo3.mp3
    http://www.oocities.org/todprog/glasdemo4.mp3
    http://www.oocities.org/todprog/glasdemo5.mp3
    http://www.oocities.org/todprog/glasdemo6.mp3
    
    http://tosh.data.bg/glasdemo2.mp3
    http://tosh.data.bg/glasdemo3.mp3
    http://tosh.data.bg/glasdemo4.mp3
    http://tosh.data.bg/glasdemo5.mp3
    http://tosh.data.bg/glasdemo6.mp3