Autor(i) |
Maria Nuțu |
---|---|
Anul publicării |
2024 |
ISBN |
978-606-19-1769-3 |
Număr de pagini |
107 |
Machine Learning based Solutions for Text Processing and Speech Synthesis
În această carte sunt prezentate rezultatele cercetării metodelor de Instruire Automată (En. Machine Learning) aplicate în două domenii: procesarea limbajului natural și sinteza text-vorbire . Pentru partea de procesare a limbajului natural, cercetarea a urmărit două direcții. În primul rând, ne-am axat pe automatizarea procesului de extragere a unor informații relevante din textele scrise. Au fost analizate modele de instruire automată, atât din sfera învățării supervizate (clasificarea textelor) cât și din cea a învățării nesupervizate (document clustering, topic modelling). Textele analizate aparțin domeniului medical și conțin informații scrise în limba engleză. Pe de altă parte, am ales să tratăm problema automatizării unor aspecte ce țin de adnotarea unui text. Ne-am concentat pe restaurarea diacriticelor, pe determinarea părții de vorbire a cuvintelor, precum și pe determinarea automată a lemei unui cuvânt. Experimentele au avut la bază texte scrise în limba română. Pentru domeniul sintezei text-vorbire, am urmărit creșterea calității textului sintetizat precum și sporirea expresivității. Am analizat mai multe arhitecturi de rețele neuronale, folosind text scris în limba română, ca date de intrare. Abordările descrise sunt originale, rezultatele fiind prezentate și publicate în lucrări în cadrul unor conferințe internaționale.