Egas López José Vicente
Adaptation of Speaker and Speech Recognition Methods for the
Automatic Screening of Speech Disorders using Machine Learning.
Doktori értekezés, Szegedi Tudományegyetem (2000-).
(2023)
PDF
(disszertáció)
Download (3MB) |
|
PDF
(tézisfüzet)
Download (753kB) |
Magyar nyelvű absztrakt
Jelen doktori értekezés olyan módszereket mutat be, amelyek bizonyos betegségekben vagy egészségi állapotban szenvedő egyének nemverbális kommunikációjának kiaknázását célozzák azok automatikus szűrésére. Konkrétabban, a nemverbális kommunikáció egyik pillérét, a paralingvisztikát alkalmaztuk olyan technikák feltárására, amelyek felhasználhatók az alanyok beszédének modellezésére. A paralingvisztika a kommunikáció egy nem lexikális összetevője, amely az intonáción, a hangmagasságon, a beszéd sebességén stb. alapszik, és amely automatikusan feldolgozható és elemezhető. Ezt Computational Paralinguistics-nak hívják, amely úgy definiálható, mint a beszélő beszédében lévő nemverbális látens minták számítási algoritmusok segítségével történő modellezése. A gépi tanulás segítségével modelleket mutatunk be mind a paralingvisztikai, mind az orvosi célú beszédelemzés különböző forgatókönyveiből, amelyek alkalmasak egy adott betegséggel (például az Alzheimer-kór, Parkinson-kór, depresszió) élő alanyok egészségi állapotának automatikus becslésére.
Absztrakt (kivonat) idegen nyelven
This PhD thesis presented methods for exploiting the non-verbal communication of individuals suffering from specific diseases or health conditions aiming to reach an automatic screening of them. More specifically, we employed one of the pillars of non-verbal communication, paralanguage, to explore techniques that could be utilized to model the speech of subjects. Paralanguage is a non-lexical component of communication that relies on intonation, pitch, speed of talking, and others, which can be processed and analyzed in an automatic manner. This is called Computational Paralinguistics, which can be defined as the study of modeling non-verbal latent patterns within the speech of a speaker by means of computational algorithms; these patterns go beyond the linguistic} approach. By means of machine learning, we present models from distinct scenarios of both paralinguistics and pathological speech which are capable of estimating the health status of a given disease such as Alzheimer's, Parkinson's, and clinical depression, among others, in an automatic manner.
Mű típusa: | Disszertáció (Doktori értekezés) |
---|---|
Publikációban használt név: | Egas López José Vicente |
Magyar cím: | Beszélő- és beszédfelismerési módszerek adaptálása betegséges automatikus előszűrésére gépi tanulás segítségével |
Témavezető(k): | Témavezető neve Beosztás, tudományos fokozat, intézmény MTMT szerző azonosító Gosztolya Gábor tudományos munkatárs, SZTE TTIK MTA-SZTE Mesterséges Intelligencia Kutatócsoport 10022623 |
Szakterület: | 01. Természettudományok > 01.02. Számítás- és információtudomány |
Doktori iskola: | Informatika Doktori Iskola |
Tudományterület / tudományág: | Műszaki tudományok > Informatikai tudományok |
Nyelv: | angol |
Védés dátuma: | 2023. március 02. |
EPrint azonosító (ID): | 11491 |
A mű MTMT azonosítója: | 34132517 |
doi: | https://doi.org/10.14232/phd.11491 |
A feltöltés ideje: | 2022. okt. 25. 15:29 |
Utolsó módosítás: | 2023. szept. 08. 15:29 |
Raktári szám: | B 7165 |
URI: | https://doktori.bibl.u-szeged.hu/id/eprint/11491 |
Védés állapota: | védett |
Actions (login required)
Tétel nézet |