Adaptation of Speaker and Speech Recognition Methods for the Automatic Screening of Speech Disorders using Machine Learning

Egas López José Vicente
Adaptation of Speaker and Speech Recognition Methods for the Automatic Screening of Speech Disorders using Machine Learning.
Doktori értekezés, Szegedi Tudományegyetem (2000-).
(2023)

[thumbnail of Dissertation Definitive Version.pdf] PDF (disszertáció)
Download (3MB)
[thumbnail of Theses Booklet.pdf] PDF (tézisfüzet)
Download (753kB)

Magyar nyelvű absztrakt

Jelen doktori értekezés olyan módszereket mutat be, amelyek bizonyos betegségekben vagy egészségi állapotban szenvedő egyének nemverbális kommunikációjának kiaknázását célozzák azok automatikus szűrésére. Konkrétabban, a nemverbális kommunikáció egyik pillérét, a paralingvisztikát alkalmaztuk olyan technikák feltárására, amelyek felhasználhatók az alanyok beszédének modellezésére. A paralingvisztika a kommunikáció egy nem lexikális összetevője, amely az intonáción, a hangmagasságon, a beszéd sebességén stb. alapszik, és amely automatikusan feldolgozható és elemezhető. Ezt Computational Paralinguistics-nak hívják, amely úgy definiálható, mint a beszélő beszédében lévő nemverbális látens minták számítási algoritmusok segítségével történő modellezése. A gépi tanulás segítségével modelleket mutatunk be mind a paralingvisztikai, mind az orvosi célú beszédelemzés különböző forgatókönyveiből, amelyek alkalmasak egy adott betegséggel (például az Alzheimer-kór, Parkinson-kór, depresszió) élő alanyok egészségi állapotának automatikus becslésére.

Absztrakt (kivonat) idegen nyelven

This PhD thesis presented methods for exploiting the non-verbal communication of individuals suffering from specific diseases or health conditions aiming to reach an automatic screening of them. More specifically, we employed one of the pillars of non-verbal communication, paralanguage, to explore techniques that could be utilized to model the speech of subjects. Paralanguage is a non-lexical component of communication that relies on intonation, pitch, speed of talking, and others, which can be processed and analyzed in an automatic manner. This is called Computational Paralinguistics, which can be defined as the study of modeling non-verbal latent patterns within the speech of a speaker by means of computational algorithms; these patterns go beyond the linguistic} approach. By means of machine learning, we present models from distinct scenarios of both paralinguistics and pathological speech which are capable of estimating the health status of a given disease such as Alzheimer's, Parkinson's, and clinical depression, among others, in an automatic manner.

Mű típusa: Disszertáció (Doktori értekezés)
Publikációban használt név: Egas López José Vicente
Magyar cím: Beszélő- és beszédfelismerési módszerek adaptálása betegséges automatikus előszűrésére gépi tanulás segítségével
Témavezető(k):
Témavezető neve
Beosztás, tudományos fokozat, intézmény
MTMT szerző azonosító
Gosztolya Gábor
tudományos munkatárs, SZTE TTIK MTA-SZTE Mesterséges Intelligencia Kutatócsoport
10022623
Szakterület: 01. Természettudományok > 01.02. Számítás- és információtudomány
Doktori iskola: Informatika Doktori Iskola
Tudományterület / tudományág: Műszaki tudományok > Informatikai tudományok
Nyelv: angol
Védés dátuma: 2023. március 02.
EPrint azonosító (ID): 11491
A mű MTMT azonosítója: 34132517
doi: https://doi.org/10.14232/phd.11491
A feltöltés ideje: 2022. okt. 25. 15:29
Utolsó módosítás: 2023. szept. 08. 15:29
Raktári szám: B 7165
URI: https://doktori.bibl.u-szeged.hu/id/eprint/11491
Védés állapota: védett

Actions (login required)

Tétel nézet Tétel nézet

Letöltések

Letöltések havi bontásban az elmúlt egy évben