Detekce kognitivních poruch pomocí opakování nesmyslných slov založeného na ASR

Krátké řečové úlohy mohou zachytit kognitivní změny bez dlouhého klinického rozhovoru. Článek zkoumá, zda lze pomocí automatického rozpoznávání řeči vyhodnotit okamžité opakování nesmyslných slov a rozlišit zdravé účastníky od osob s kognitivní poruchou. Experiment ukazuje, proč při zapojení řečových technologií do screeningu záleží na chybách rozpoznávání, fonologické podobnosti i volbě jazykového modelu.

Opakování nesmyslných slov je krátká úloha, která současně zapojuje vnímání řeči, krátkodobou paměť a řečovou produkci. Protože nejde o známá slova, nelze výsledek jednoduše opřít o slovní zásobu.

Článek zkoumá, jak může automatické rozpoznávání řeči podpořit analýzu této úlohy při výzkumu kognitivních poruch. Práce je součástí projektu DigiDiaDem, který vytváří měřitelné a opakovatelné součásti vzdáleného vyšetření řeči a paměti.

Úloha doplňuje širší studii řečově-kognitivního datasetu DigiDiaDem a související práci se sémantickou analýzou mluvených popisů obrázků.

Screenshot stránky Springer pro článek Detection of Cognitive Disorders Using ASR-Based Nonsense Words Repetition — Záznam konferenčního článku ve sborníku Text, Speech, and Dialogue.

Autoři

Jan Tupý, Jan Švec, Luboš Šmídl

Abstrakt

We investigate whether immediate repetition of nonsense words can distinguish cognitively healthy adults from those with mild cognitive impairment (MCI) or dementia. In a computer-based study, 129 Czech speakers (45–84 y) repeated six pseudowords; each session was recorded and transcribed by four state-of-the-art ASR models. Grapheme-level similarity between the transcript and the target word served as a phonological accuracy score. Using logistic regression, the best ASR variant (wav2vec-nolm, no language model) separated patients from controls with 77 % accuracy, whereas language-model–’corrected’ hypotheses performed markedly worse. These findings show that a very short, vocabulary-free task can reveal early linguistic decline while requiring only consumer hardware and minimal instruction. Incorporating such a nonsense word repetition subtask into digital neuropsychological batteries could therefore sharpen large-scale, remote screening and help clinicians focus full assessments on individuals at greatest risk.

Odkazy na publikaci

DOI: 10.1007/978-3-032-02548-7_21

Autoři

Abstrakt

Odkazy na publikaci

Číst dále