Halláscsökkenés és halláscsökkenés. A beszédérthetőség maximális javulása Csökkent hallás és beszédérthetőség

Az emberi beszédérthetőség károsodása, különösen háttérzaj esetén, a hallókészülék használóinak egyik fő problémája. A modern hallókészülékek fejlesztői és gyártói tisztában vannak ezzel, és mindent megtesznek ennek a nehéz problémának a megoldására. Szinte minden modern digitális hallókészülék speciális rendszerekkel, ún zajcsökkentő rendszerek", ami lehetővé teszi az idegen hangok beszédjelre gyakorolt hatásának csökkentését. Sajnos azonban ezeknek a rendszereknek a többsége a hallókészülék erősítésének csökkentésén alapul bizonyos frekvenciatartományokban. Más szóval, a zajelnyomással együtt az eszköz részben elnyomja a beszédet. Ennek eredményeként a beszédérthetőség továbbra sem kielégítő.

A Widex audiológusai ismét nem szabványos megoldást kínálnak erre a problémára. Egy egyedülálló rendszerről beszélek" Beszédjavító”, amely a Mind, Inteo, Passion sorozat modern Widex készülékeivel van felszerelve. Ez a rendszer egy összetett, teljesen automatikus algoritmust használ, amely a felhasználó hallássérültségére, a beszélgetőpartner beszédének természetére és a háttérzaj jellemzőire vonatkozó adatok elemzésén alapul. Ennek köszönhetően a hallókészülék optimalizálja valamennyi rendszerének működését, így bármilyen hangkörnyezetben, még a legzajosabb is, a beszéd erősítése mindig lényegesen nagyobb, mint a zajjel erősítése. Ily módon a Widex a lehető legmagasabb beszédérthetőséget biztosítja minden hallgatási helyzetben.

A Widex másik egyedülálló fejlesztése az úgynevezett lineáris frekvenciatranszponáláson alapuló rendszer. Ezt a rendszert " Hallástávnövelő" A helyzet az, hogy néha még a legfejlettebb és legerősebb hallókészülék használata sem kompenzálja teljesen a felhasználó halláskárosodását. Súlyos halláskárosodás eseteiről beszélünk a nagyfrekvenciás régióban. Néhány évvel ezelőtt azt mondtuk volna az ilyen betegeknek: Sajnos nem fogja tudni hallani a magas frekvenciájú hangokat" Amikor magas frekvenciájú hangokról beszélünk, akkor nem csak a madarak énekére, az ébresztőóra hangjára vagy a fuvola dallamára gondolunk. Gondolunk az emberi beszédet alkotó magas frekvenciájú hangokra is. E hangok nélkül lehetetlen megfelelő beszédérthetőséget elérni, és ami különösen fontos, a gyermek beszédének helyes és teljes fejlesztése lehetetlen.

« Hallhatósági tartomány kiterjesztője"átviszi a legjelentősebb hangjelek egy részét a nagyfrekvenciás részről a mögöttes régióba. Pontosan azon a területen, ahol a hangérzékenység megmarad. Így egy személy még a hallás teljes hiánya a magas frekvenciájú tartományban újra hallani kezdi ezeket a hangokat. Természetesen ezeknek a hangoknak a hangzása eltér az eredetitől. Ezek azonban hasonlóak maradnak az eredeti eredeti jelhez. A rendszert hosszú távú klinikai vizsgálatoknak vetették alá gyermekek és felnőttek bevonásával számos audiológiai laboratóriumban, köztük az USA-ban és Ausztráliában is, melyek eredményei a magas hatékonyságot jelzik.

Nem szabad azonban elfelejteni, hogy minden használat esetén " Hallástávnövelő» egyéni megközelítést kell alkalmazni a páciens specifikus hallássérülésének megfelelően, és hosszú felhasználói alkalmazkodási időszak szükséges (egyes esetekben 2-3 hónap). Egészen a közelmúltig ilyen rendszert mutattak be a Widex Inteo sorozatú készülékek. Örömmel jelentjük be, hogy most, az új hallókészülék-sorozat, nevezetesen a Mind-440 és Mind-330 megjelenésével a rendszer elérhetőbbé vált hallókészülék-használóink számára.

A Widex orosz képviseletének audiológusa
Bronyakin Sztanyiszlav Jurijevics

UDC 534,773

I.V. PRASOL, Ph.D. tech. Tudományok, KNURE (Kharkov),

MINT. NECHIPORENKO, KHNURE (Kharkov)

A BETEGEK BESZÉDINTELLIGENCIÁJA NÖVELÉSÉNEK MÓDSZERE

ÉRZÉKELÉSI HALLÁSVÉGSÉG

A szenzorineurális halláskárosodásban szenvedő betegek beszédértésének javítására új módszert javasoltak, amely a beszédjel szűrésén alapul. A szűrés eredményeként lehetőség nyílik a hullámspektrum legjelentősebb, a betegségek kezelése szempontjából releváns területeinek megerősítésére. Ez a módszer lehetővé teszi a nyelv fokozott elnyelését olyan betegeknél, akiknél az 1 kHz feletti frekvenciatartományban az érzékenység csökken.

Egy új módszert javasolnak a beteg emberek frázisintelligenciájának javítására. Szenzoros halláscsökkenés. A szűrőhangon alapul. A szűrés eredményeként a beszédspektrum legjelentősebb, a betegek beszédészlelést befolyásoló területeit detektáljuk. Ez a módszer segít javítani az 1 kHz feletti halláscsökkenésben szenvedő betegek beszédérzékelését.

A probléma megfogalmazása. Manapság egyre többen szenvednek halláskárosodástól. A halláskárosodás okai különbözőek lehetnek, beleértve a túlzott zajnak való tartós kitettséget, a környezet általános romlását, a betegségeket követő szövődményeket, sérüléseket és genetikai rendellenességeket. A hallórendszer patológiái közül a vezető a szenzorineurális halláskárosodás - gyengült hallás megőrzött beszédérzékeléssel, amelyet a hangvevő készülék vagy a halláselemző központi részének károsodása okoz. Mind a spirális szerv neuroszenzoros hámsejtjei, mind a szubkortikális és kérgi hallóközpontok károsodásának következménye lehet. Leggyakrabban azonban a szenzorineurális halláskárosodást a vestibulocochlearis ideg receptorának és gyökerének patológiája okozza. Ez a betegség műtéttel nem gyógyítható, ezért hallókészüléket írnak fel a betegnek. A hallókészüléknek korrigálnia kell az ilyen típusú patológiákra jellemző egyéni hallásjellemzőket. Erre a célra számos hangfeldolgozó algoritmust alkalmaznak az analóg hallókészülékekben. Ezek a frekvenciafüggő erősítés, az amplitúdótömörítés és a zajszűrés algoritmusai. A beszédjelek feldolgozására szolgáló összetett, a betegek halláskárosodásának egyéni természetéhez igazodó algoritmusok megvalósítása azonban csak digitális hallókészülékekben lehetséges. A digitális jelfeldolgozás lehetővé teszi rendkívül hatékony adaptív algoritmusok használatát, amelyek lehetővé teszik a paraméterek egyedi konfigurálását, miközben a hardvermag változatlan marad.

Irodalmi elemzés. Elvégeztem a digitális jelfeldolgozási módszerek elemzését. A beszédjel észlelésének jellemzői, a formánsok spektrumából való elkülönítésének meglévő módszerei, valamint módszerek

beszédjel-feldolgozás, amely lehetővé teszi a jel érthetőségének növelését mind a normál hallású, mind a szenzorineurális halláskárosodással diagnosztizált nagyothalló betegek számára. A beszédérthetőség növelésére szolgáló meglévő módszerek azonban nem veszik figyelembe a neuroszenzoros patológia olyan jellemzőjét, mint a hallhatóság elvesztése az 1 kHz feletti tartományban. A formáns elemzést nem alkalmazták adaptív algoritmusok létrehozására a verbális érthetőség javítására.

Ennek a cikknek a célja egy módszer kidolgozása a szenzorineurális halláskárosodásban szenvedő betegek beszédérthetőségének növelésére.

Beszédérthetőség szenzorineurális halláskárosodásban szenvedő betegeknél.

Ismeretes, hogy a szenzorineurális halláskárosodást a hallásküszöb növekedése, valamint a hallhatóság romlása jellemzi az 1 kHz feletti tartományban, ami viszont az ilyen betegeknél a beszéd magas frekvenciájú összetevőinek észlelésének elvesztéséhez vezet. . Ennek a korlátozott észlelésnek a következménye a beszédérthetőség jelentős romlása. Ennek oka a beszédjel hangjainak sajátos lokalizációja, nevezetesen: a mássalhangzó hangok többnyire az 1 kHz feletti frekvenciatartományban, a magánhangzók pedig az alacsony frekvenciájú tartományban találhatók. Mivel a beszédérthetőséget túlnyomórészt a mássalhangzók észlelése befolyásolja, a fennmaradó beszédspektrum a magánhangzók elterjedtsége miatt homályossá és nehezen érthetővé válik. A fentiek alapján javasolt a beszédjel érthetőségének javítása a tisztaság növelésével a spektrum egyes részeinek eltávolításával.

A beszédjel észlelésének sajátosságai. Bármely beszédjel a legegyszerűbb beszédhangokból, az úgynevezett fonémákból áll. Ismeretes, hogy minden fonéma megfelel az emberi hangcsatorna saját alakjának, amely a nyelv, az ajkak, a fogak helyzetének változásaitól függően változik, és ettől függően a hangcsatorna frekvenciái, beleértve a rezonánsokat is, is változni. A beszédjel spektrális maximumainak a hangpálya rezonanciafrekvenciáinak megfelelő területeit formánsoknak nevezzük. A formánst frekvencia, szélesség és amplitúdó jellemzi. A fonémafelismerés a formánsok, mint a beszédjel leginformatívabb jellemzőinek észlelésén alapul. Azt is meg kell jegyezni, hogy az egyes fonémák felismerése elsősorban az első két formáns helyzete alapján történik. Figyelembe véve ezeket a tényezőket, valamint a szenzorineurális halláskárosodásban szenvedő betegek olyan jellemzőjét, mint a frekvenciaszelektivitás csökkenése, javasolt a formáns sávokkal határos területek eltávolítása a beszédspektrumból.

Beszédjel szűrése. A kísérlet során több, különböző hangszóróból érkező jelet dolgoztak fel. A beszédjelet digitális kóddá alakították és számítógépen dolgozták fel. Mert

A magánhangzók formáns csúcsainak azonosítására a „Cool Edit Pro” szoftvercsomagot használták, amely lehetővé teszi a beszédjel spektrális elemzését. A diszkrét formában bemutatott analóg jel spektrális jellemzőinek meghatározásához gyors Fourier-transzformációt (FFT) alkalmaztunk, melynek eredménye a jel n frekvenciás halmazként való megjelenítése.

F = (F1,F2,...,Fn ). (1)

A zajforrások beszédjelre gyakorolt hatása olyan pillanatnyi spektrumcsúcsok kialakulásához vezethet, amelyek nem részei a beszédjelnek. Az ilyen csúcsokat hamis csúcsoknak nevezzük.

Határozzuk meg a csúcsot, mint a jelenergia maximális intenzitását egy adott d intervallumban a frekvenciatengelyen, és fejezzük ki a P(Fk, d) függvényt a d intervallum maximumának ellenőrzésére a következőképpen:

G1, A esetén > max L, k Ф j,

én a k-d

P(Fk, d) = \ j (2)

10, Ak< ІШХ Aj , k ф j.

^k-d

Ekkor az összes csúcs megtalálása az F є F kiterjesztési frekvenciák meghatározására redukálódik, amelyekre a P(F, d) = 1 feltétel teljesül. Ezt a csúcskeresési módszert szekvenciális áthaladásnak nevezzük.

Mivel a beszédjel felismerésére az első két formáns van a legnagyobb hatással, az első két csúcs formáns régióit szűrjük. ábrán. Az 1. ábra a pillanatnyi spektrumot mutatja

jel (egy kiválasztott formáns) a szűrés előtt. ábrán. 2 látható

azonnali spektrum szűrés után. A szűrést a következő képletek szerint végeztük:

Fa = Fk - mx2 1, (3)

F = F + _2-------maxL (4)

A b i max 1 2’ ^"

ahol Fa, F1, Fb, F2 az eltávolítandó formáns régiók határai; Fmax - csúcs formáns frekvencia.

F = F + F 2 F max (4)

A szűrés eredményeként kiemelésre kerülnek a beszédspektrum legjelentősebb területei, valamint csökken a formáns sávok maradó sávok alsó határfrekvenciáinak maszkolása.

A szükséges szűrők létrehozásához magánhangzók és mássalhangzók gyakorisági elemzését végeztük el. A spektrális burkológörbe nagyszámú egyedi frekvenciák csúcsát tartalmazza, de ezek többsége nem informatív, és az 1500 Hz feletti tartományban található. Az alapvető beszédinformációkat beviszik

maga viszonylag nagy amplitúdóval a 70 Hz - 900 Hz tartományban csúcsosodik ki. ábrán. A 3. ábra az „E” hang spektrumát mutatja, ahol jól láthatók ebben a tartományban a formánscsúcsok.

Rizs. 2. Formant sort a szűrés után

Rizs. 3. "E" hangspektrum a szűrés előtt 163

Rizs. 4. "E" hangspektrum szűrés után

A frekvenciasávokat az RBT szűrő menüpontban létrehozott szűrők segítségével távolítottuk el a számított adatok szerint. Ennek eredményeként megkaptuk a jel spektrális karakterisztikáját, amelyet az ábra mutat be. A 4. ábra alapján arra következtethetünk, hogy a formáns régiók szűkülnek, valamint a jelamplitúdó növekszik az első két formánscsúcs tartományában.

ábrán. Az 5-8. ábrák a Zh, B hangok spektrális jellemzőit mutatják szűrés előtt és után.

Rizs. 5. Hangspektrum "Zh" szűrés előtt 164

Ily módon a teljes beszédsorozat minden egyes hangját feldolgozták. Mivel a szenzorineurális halláscsökkenésben szenvedő betegek hallásgörbéjének csökkenése 1 kHz-nél kezdődik, a spektrumra egy szűrőt is alkalmaztak, amely levágta az 1 kHz feletti frekvenciákat.

Rizs. 6. "Zh" hangspektrum szűrés után

Rizs. 7. A "B" hang spektruma szűrés előtt

Rizs. 8. A "B" hang spektruma szűrés után

A javasolt feldolgozási módszer észlelésre gyakorolt hatásának felmérése

beszéd. A javasolt feldolgozási módszer beszédjel észlelésére gyakorolt hatásának felmérésére egy 20 fős, szenzorineurális halláskárosodásban szenvedő emberből álló csoportot kértek meg, hogy hallgassanak meg és hasonlítsanak össze két jelet: az eredetit és az előfeldolgozáson átesettet. Minden betegnek volt több éves tapasztalata a hallókészülékek használatában. Meg kell jegyezni, hogy a betegek kezdeti beszédérthetősége alacsony (kevesebb, mint 51%). Az érthetőség felmérésére Greenberg többszótagú szavak beszédtáblázatait használták, figyelembe véve az orosz beszédre jellemző fonetikai jellemzőket. A kimenő jelet semmilyen további átalakításnak nem vetették alá, kivéve a hangerő beállítását, hogy egy adott páciens kényelmesen érzékelje. A 6 főre végzett vizsgálat eredményeit a táblázat tartalmazza.

Kutatási eredmények

Szenzorineurális halláskárosodással diagnosztizált alanyok Az eredeti beszédjel érthetősége (%) A feldolgozott beszédjel érthetősége (%)

A halláskárosodás mértéke Az alany életkora

Következtetések. A kapott adatokat elemezve megállapítható, hogy a betegek beszédérthetősége 5-18% tartományban növekszik. A többi beteg vizsgálati eredményei hasonlóak voltak, az érthetőségi értékek a fenti tartományon belül voltak. Következésképpen a formánsokat határoló spektrum frekvenciasávjainak szűrése következtében a beszédjel tisztasága növekszik. A spektrum leginformatívabb területeinek elkülönítése segít a beszédsor észlelésének javításában, a beszéd érthetőbbé és érthetőbbé válik. A javasolt beszédjel-feldolgozási módszer alkalmazása megbízhatóan növelheti a beszédjelek érthetőségét szenzorineurális halláskárosodásban szenvedő betegeknél. Ezáltal lehetőség nyílik egy adaptív algoritmus létrehozására a verbális érthetőség javítására.

Felhasznált irodalom: 1. Neiman L.V., Bogomilsky M.R. A halló- és beszédszervek anatómiája, élettana és patológiája. - "Vlados", 2001. - 224 p. 2. Prasol I.V., Kobylinsky A.V. Módszertan az orvosbiológiai eszközök digitális áramköreinek optimalizálására // Alkalmazott rádióelektronika. - 2007. -T. 6. - 1. sz. - P. 51-55. 3. Prasol I.V., Kobylinsky A.V. Algoritmusok adaptív digitális hallókészülékek tervezéséhez / 7. tudományos-műszaki konferencia "Orvosi technológiák az egészség védelméért." Tudományos dolgozatok gyűjteménye. - M.: MSTU im. N.E. Bauman, 2005. - 54-56. 4. Rabiner L., Gould B. A digitális jelfeldolgozás elmélete és alkalmazása. - M.: Mir, 1978. - 848 p. 5. Gelfand S.A. Hallás: Bevezetés a pszichológiai és élettani akusztikába. - M.: Orvostudomány, 1984. 6. Petrov S.M. Beszédjel sáváteresztő szűrése - beszédészlelés normál körülmények között és szenzorineurális hallásveszteséggel // Bulletin of Otorhinolaryngology. - 2000. - 3. sz. - P. 55-56. 7. Rabiner L.R., Shafer R.V. Beszédjelek digitális feldolgozása. - M.: Rádió és Hírközlés, 1981. - 496 p. 8. ttp://www.adobe.com/special/products/audition/syntrillium.html. 9. Szerdjukov V.D. Beszédjelek felismerése a zavaró tényezők hátterében. - Tbiliszi: Tudomány, 1987. - 142 p. 10. Chistovich L.A., Ventsov A.V., Granstrem M.P. A beszéd élettana. Az emberi beszéd észlelése. - L.: Nauka, 1976. - 388 p. 11. James L. Flanagan A beszéd elemzése, szintézise és észlelése. - M.: Kommunikáció, 1968. - 396 p.

Mindannyian nem egyszer kerültünk olyan helyzetbe, hogy a különböző zajzavarok annyira megzavarták a beszélgetést, hogy a beszélgetőtárs szavai teljesen érthetetlenné váltak. És ha ilyen körülmények között készít videót, a keretben hallható beszéd teljesen érthetetlenné válik, mivel a beszélgetőpartnerrel való vizuális kapcsolat is eltűnik.

Sajnos az interneten keresztül továbbított beszéd minősége sok kívánnivalót hagy maga után. Bárki, aki a meglévő kommunikációs programok egyikét használja például a H.323 protokollon alapuló Voice over IP-re, ezt ellenőrizheti. Ugyanakkor nem számíthatunk a hangátvitel minőségének alapvető javulására az interneten meglévő útválasztási módszerekkel, mert eddig azt hitték, hogy az ilyen kommunikáció felhasználóinak köre nagyon korlátozott. Úgy tűnt, ez csak a személyi számítógépek egyéni tulajdonosait érdekelheti, akik megfizethető áron kommunikálnak barátaikkal a világ másik felén, vagy a vállalati felhasználókat, akik megpróbálják csökkenteni a különböző városokban található irodák közötti kommunikáció költségeit. De ha az internetes telefonálást közszolgáltatássá teszi, amelyért pénzt lehet fizetni, akkor természetesen javítani kell az általa nyújtott kommunikáció minőségén.

A beszéd érthetősége

mi a beszédérthetőség? Elvileg az érthetőség a beszédjel integrált értékelése, és az ISO/TR 4870 nemzetközi szabvány szerint úgy definiálható, mint „a beszéd hallgató általi megértésének (megfejtésének) mértéke”. Ez arra utal, hogy a hallgatók mennyire képesek megérteni egy kifejezés jelentését, és milyen mértékben képesek azonosítani a szavakat, szótagokat és fonémákat. Ennek megfelelően az érthetőség különböző típusait különböztetjük meg: fonemikus, szótagos, verbális és frazális, amelyek azonban mind szorosan összefüggenek egymással, és átválthatók egymásba.

Egy ilyen meghatározás azonban szubjektív, és valamilyen vizsgálat megszervezését igényli. Az érthetőség meghatározására, különösen a nézőterek, színházak, koncerttermek, stúdiók és egyéb helyiségek akusztikai tulajdonságainak értékelése során, a gyakorlatban különféle módszereket és szabványokat alkalmaznak: GOST 25902-83, GOST 51061-97, ANSI S3.2 stb. De mindegyik meglehetősen bonyolult, időigényes és költséges eljárásokat kínál, az érthetőség meghatározásának objektív módszereit, amelyek lehetővé teszik a gyors és automatizált, a szubjektív vizsgálatokkal jól illeszkedő értékeléseket, még nem eléggé kidolgozottak, bár a munka sok éve folyik. .

Jelenleg számos ilyen módszert fejlesztettek ki: AI (Articulation Index) - artikulációs index; %ALcons (Percentage Articulation Loss of Consonants) – a mássalhangzók artikulációs veszteségének százalékos aránya; STI (Speech Transmission Index) - beszédátviteli index; RASTI (Rapid Speech Transmission Index) - gyors beszédátviteli index; SII (Speech Intelligibility Index) - beszédérthetőségi index és sok más, amely megfelel az ISO/TR-4870, ANSI S3.2, S3.5 szabványoknak; IEC 268-16 stb.

Például a nemzetközi szabályozó dokumentumok által szabályozott kritériumok egyike a dimenzió nélküli együttható, amely 0 és 1 között változhat. Ezen túlmenően ennek értékei korrelálnak a beszédérthetőség szubjektív értékelésével, a következő szabványos összefüggés szerint:

Az érthetőség kiszámításához a beszédjel frekvenciasávját 150 és 7000 Hz közötti tartományban választják ki (vagy 125 és 8000 Hz közötti margóval), mivel az orosz beszéd szinte minden magánhangzója és mássalhangzója ebben a sávban található. Amint látható, a beszédjel ebben az esetben elég széles sávú ahhoz, hogy a különféle interferenciák negatívan hozzájáruljanak az érthetőség csökkenéséhez. Ebben az esetben a mássalhangzó hangok fő energiája 2000 Hz körül összpontosul, aminek köszönhetően a zajjal történő maszkolás eredményeként megközelítőleg ezen a frekvencián az észlelés valószínűsége jelentősen csökken (megjegyezzük azt is, hogy a mássalhangzó hangok szintje alacsonyabb és ezért gyorsabban eltűnnek), és ennek következtében a beszédérthetőség szintje csökken . Érdekes megjegyezni, hogy a hangérthetőség közel felének elvesztésével a szótagok érthetősége 80%-os szinten marad, vagyis a beszédnek elegendő mozgástere van információredundanciában.

Amint az elemzés azt mutatja, a beszédjel megközelítőleg úgy tekinthető, mint valamilyen szélessávú jel, amelyet egy másik, alacsony frekvenciájú jel modulál. A modulációs frekvenciát az határozza meg, hogy egy személy milyen sebességgel ejti ki a frázisokat, vagyis az artikuláció sebessége. Kísérletek kimutatták, hogy a közönséges beszéd modulációs frekvenciája 0,63 és 16 Hz között van, a legvalószínűbb modulációs frekvenciák pedig az 5-7 Hz tartományban vannak. Ennek megfelelően a modulációs mélység csökkentése a beszédjelet jobban hasonlítja a zajhoz, és ezáltal annak érthetőségének csökkenéséhez vezet. Ha egy beszédjel bármely átviteli úton áthalad, a torzításokat és a zajt is figyelembe véve, a jel érthetősége csökken, ami a modulációja (a jelburok alakjának változása) mélységének csökkenése alapján értékelhető.

Hogyan oldják meg a szakemberek ezt a problémát?

Azt kell mondanunk, hogy a szakemberek igyekeznek egyáltalán nem foglalkozni az érthetetlen beszéddel, és inkább azonnal tiszta hangot rögzítenek - akár külön-külön, akár speciális szűk irányítású mikrofonokkal.

A már felvett beszéd érthetőségének növelésének problémájának megoldására valahogyan alkalmas berendezések hosszas keresése eredményeként a szerző mindössze egy őrülten drága sáváteresztő zajcsökkentő eszközt tudott találni a Dolby Laboratories-tól, Cat néven. Nem. 43 (kérjük, ne keverje össze ugyanazon cég zajcsökkentő eszközeivel).

Valójában a látszólag szélessávú beszédspektrumból ki lehet választani azokat a frekvenciasávokat, amelyekben a beszédkomponens akusztikus energiájának maximuma van, és ezeket külön-külön lehet feldolgozni, ezáltal a hasznos jel megtisztul. Mondanunk sem kell, hogy gondos kézi munka vár rád, ha természetesen javítani szeretnéd a beszéd érthetőségét – anélkül, hogy az eredeti hangsáv dinamikatartományát veszélyeztetnéd. Természetesen minden „új” csatornán dolgozni kell a hangfelvételek átlagos sűrűségén és a „hasznos jel/interferencia” arányon.

A szakemberek előnyben részesítik a tiszta hang azonnali rögzítését, különben az utólagos feldolgozást olyan rendszerekben, mint a Dolby Laboratories Cat. Nem. 43 sokba kerül nekik

De miért nem oldja meg ezt a problémát programozottan, „okos” számítógépek segítségével? Úgy tűnik, vannak hasonló termékek gyártói (például SIA Software, DAC vagy ugyanaz a Dolby Laboratories), de úgy tűnik, hogy ezen a területen a siker ugyanolyan szintű, mint az automatikus beszédfelismerő és szöveggé konvertáló programok esetében. Így jelenleg gyakorlatilag nem léteznek ilyen programok valódi munkához (és még oroszul is), és nyilvánvalóan nem is fognak hamarosan elkészülni.

Úgy tűnik azonban, hogy a szentpétervári „Center for Speech Technologies” (CRT), amely 1990 óta dolgozik ezen a területen, sikereket ért el. A TsRT cég (www.speechpro.ru) arzenáljában egy sor szoftver és hardver található, amelyeket a zajcsökkentésre és a hangminőség javítására, és elsősorban a beszédjelekre terveztek - ezek számítógépes programok, önálló eszközök, táblák (DSP) ) beépített hanginformációs csatornák rögzítésére vagy továbbítására szolgáló eszközökbe. A vállalat különösen olyan programokat fejlesztett ki, mint a SIS, SoundCleaner, valamint a „Cinderella”, „Silence” sorozat hardvereszközeit. Ezek az eszközök növelik a beszéd érthetőségét zajos és torzító körülmények között, így kényelmesebbé teszik a hallgatást. a repülőgép-személyzetnek, légiforgalmi irányítónak, segélyszolgálat üzemeltetőjének, mozdonyvezetőnek stb. szükséges. Ezen túlmenően egy ilyen eszköz beépíthető szinte bármilyen analóg vagy digitális telefonba, rádióállomásba, telefonfejhallgatóba stb.

Például a „Silence” tábla első vásárlója egy amerikai cég volt, amely a NASCAR versenyeken használja, hogy kiváló minőségű kommunikációt biztosítson a pilóta, a csapat és a szurkolók között.

A cég szakemberei részt vettek az elsüllyedt Kurszk tengeralattjáró fedélzetén rögzített hanginformációk helyreállításában (hat hónapos munka eredménye 23 CD 120 órányi hanginformációval és 340 oldal szó szerinti beszédfonogram), lezuhant repülőgépeken, valamint a nyomozás során számos olyan büntetőügy, amelyek esetében a beszédhangfelvétel tartalmának megállapítására volt szükség.

SoundCleaner

Az MDG zajtisztító termékcsalád vitathatatlan vezetője a SoundCleaner szoftvercsomag. 2000-ben a SoundCleaner programot hivatalosan is bejegyezte az Orosz Szabadalmi és Védjegyügynökség.

A SoundCleaner beszédzajtisztító komplexum egy professzionális szoftver- és hardverkészlet, amelyet a beszédérthetőség helyreállítására és a nehéz akusztikai körülmények között rögzített vagy kommunikációs csatornákon továbbított hangjelek tisztítására terveztek.

A SoundCleaner, a hordozható beszédzajcsökkentő rendszer segíthet a javításban
nehéz akusztikai körülmények között rögzített gyenge minőségű beszédfonogramok érthetősége és szöveges átírása

Ez egy igazán egyedi szoftvertermék, amelyet arra terveztek, hogy megtisztítsa a zajt és javítsa az élő (vagyis valós időben vett) vagy rögzített hangjelek hangminőségét. És éppen ez segíthet az érthetőség növelésében és a rossz minőségű beszédhangok nehéz akusztikai körülmények között rögzített (beleértve az archívumot is) szöveges dekódolásában.

Természetesen hatékonyabban működik az ismert természetű zajok és hangtorzítások esetén, mint például a kommunikációs és hangrögzítési csatornák tipikus zajai és torzításai, beltéri és kültéri zajok, gépek, járművek és háztartási gépek üzemeltetése, hang „koktél”, lassú zene, elektromágneses interferencia a rendszerek tápellátásából, például számítógép- és egyéb berendezések zaja, visszhang és visszhanghatások. Alapvetően minél szabályosabb és egyenletesebb a zaj, a SoundCleaner annál sikeresebben bánik vele.

Kétcsatornás információgyűjtéssel azonban jelentősen csökkenti bármilyen típusú zaj hatását. Például a SoundCleaner kétcsatornás adaptív szűrési módszerekkel rendelkezik, amelyek mind a szélessávú, nem helyhez kötött interferenciák (például beszéd-, rádió- vagy televízióadások, teremzaj stb.), mind pedig az időszakos (rezgések, hálózati zajok stb.) elnyomására szolgálnak. Ezek a módszerek azon a tényen alapulnak, hogy egy hasznos jel azonosításakor további információkat használnak a referenciacsatornában megjelenő interferencia tulajdonságairól.

Ha nem szabványos problémákat kell megoldani bizonyos hangfelvételek feldolgozásakor, akkor a SoundCleaner program lehetőséget biztosít a jelfeldolgozási eljárás rugalmas konfigurálására, beleértve magának a feldolgozási sémának a szerkesztését is. Így bármely képzettségi szintű felhasználó sikeresen megoldhatja a zajcsökkentési problémákat automatikus vagy manuális programbeállításokkal. A kevésbé tapasztaltak számára 13 kész séma áll rendelkezésre a jelek legjellemzőbb zajának és torzításának feldolgozására (elektromos interferencia, közlekedési zaj, frekvencia- és amplitúdótorzítás, rádióinterferencia stb.), amelyek segítenek a különféle típusok elleni küzdelemben. ismert zaj és interferencia. Sőt, az egyes sémák módosíthatók, és a tapasztaltabb felhasználók saját sémákat fejleszthetnek, amelyeket ezután szabványos sémaként menthetnek el újrafelhasználásra.

A szállítókészlet hangfájlokat tartalmaz a zajos beszédjelek példáiról, valamint ezek feldolgozására optimalizált konfigurációk és szűrőáramkörök, így a tanulás és a programmal való munka egyszerű és meglehetősen hatékony lesz.

Az 5.10-es verziótól kezdődően a SoundCleaner DirectX beépülő modulként működhet, miközben az offline működéshez szükséges összes funkciót megőrzi. Ebben a módban a program olyan jól ismert hangszerkesztők részeként működhet, mint az Adobe Audition (1.0 és újabb), a Sound Forge (6.0 és újabb) vagy a Wave Lab 4.0. Az offline működéshez elvileg a SoundCleaner saját hangszerkesztővel, Wave Assistant szerkesztővel rendelkezik, amely szabványos eszközöket tartalmaz a jelek szerkesztéséhez, valamint részletes elektroakusztikus és spektrális elemzésének elvégzéséhez az optimális feldolgozási mód kiválasztásához.

Szerkezetileg a program egy önálló modulkészlet a hanggal való munkához (összesen 19 ilyen modul van), amelyek a fő héjban vannak kombinálva. Minden modul saját vezérlőpanellel rendelkezik, és saját algoritmusa szerint dolgozza fel a hangot, majd továbbítja azt a következő modulnak. Az egyidejűleg használt modulok teljes számát csak a számítógép számítási képességei korlátozzák.

A szoftvercsomag architektúrája lehetővé teszi a felhasznált modultípusok számának egyszerű növelését, ezzel biztosítva a program hosszú életciklusát (mivel a cég egyre több új modult hoz létre). A program lehetővé teszi, hogy ilyen modulokból hozzon létre és három különböző típusú feldolgozó áramkört használjon: egycsatornás mono jelhez vagy kétcsatornás független feldolgozással a bal és a jobb csatornában (egyes esetekben két különböző csatorna felhasználásával az elkülönítéshez a hasznos jel rendkívül hatékony).

A jel (feldolgozás előtt és után) folyamatosan oszcillogramként és pillanatnyi spektrumként jelenik meg. A zajcsökkentés valós időben vezérelhető: az egyes modulok beállításait bármikor módosíthatja a lejátszás megszakítása és jelvesztés nélkül, ami nagyon fontos a paraméterek gyors, szó szerint történő kiválasztásához.

Az audiojel bevihető és feldolgozható külső forrásból (audio berendezés lineáris kimenete, mikrofon) vagy wav hangfájlból. A program képes monó vagy sztereó jelekkel dolgozni 8 és 16 bites PCM, mu(a)-Law vagy 24 bites lebegő formátumban 8-48 kHz mintavételezési frekvenciával, és feldolgozás után az eredeti mintavételezési frekvencián 16 -bites PCM formátum.

ClearVoice Denoiser automatikus zajcsökkentő bemutató program

A SoundCleaner Windows 9x/Me/NT/2000/XP alatt fut normál PC-n (Pentium II-től vagy Celerontól kezdve 64 MB RAM-mal), szabványos Windows-kompatibilis full-duplex hangkártyával. A termék régebbi verzióinak garantáltan jó minőségű bemeneti és kimeneti jeleinek eléréséhez professzionális jelbemeneti/kimeneti eszközöket biztosítunk: 16 bites STC-H216 vagy 24 bites STC-H246 „hangvilla”. A program orosz nyelvű felhasználói felülettel rendelkezik. A cég honlapjáról letöltheti a ClearVoice Denoisert, egy demóprogramot az automatikus zajcsökkentéshez. A SoundCleaner program alapvető zajtisztító algoritmusai szintén beágyazott szoftvermodulok (SDK) készleteként valósulnak meg, amelyeket más szoftverfejlesztők is használhatnak. Az SDK demóverziói elérhetők a gyártó webhelyén.

A számítógépes átíró sajnos még nem a beszéd automatikus felismerésére és szöveggé alakítására alkalmas program. Jelenleg nem léteznek ilyen programok valódi orosz nyelvű munkához, és valószínűleg nem is fognak hamarosan megjelenni. Az átíró inkább egy számítógépes digitális magnó, amelyet egy speciális szövegszerkesztő vezérel.

Ezeket az eszközöket arra tervezték, hogy növeljék a szóbeli beszéd hangfelvételeinek dokumentálásának sebességét és kényelmét riportok, megbeszélések jegyzőkönyvei, tárgyalások, előadások, interjúk, papírmentes irodai munka és sok más esetben. Egyszerűségük, könnyű kezelhetőségük és a nem professzionális kezelők számára elérhetőségük különbözteti meg őket: a gépelés sebessége a professzionális érintéses gépelőknél 2-3-szorosára, a nem profiknál pedig 5-10-szeresére nő! Ezenkívül a magnó és a szalag mechanikai kopása jelentősen csökken, ha analóg forrásról beszélünk. Ugyanakkor a számítógépes átírók interaktív képességgel rendelkeznek a beírt szöveg és a megfelelő hangsáv összehasonlítására. A szöveg és a beszéd közötti kapcsolat automatikusan létrejön, és lehetővé teszi, hogy azonnal automatikusan megtalálja és meghallgatja a beszédjel megfelelő hangrészleteit a begépelt szövegben, amikor a kurzort a vizsgált szövegrészletre viszi.

A beszédérthetőség növelése itt egyaránt elérhető a lejátszási sebesség lelassításával a hangszín torzítása nélkül, és az érthetetlen töredékek csengetési módban történő többszöri ismétlésével.

Megrendelő kérésére a cég lábpedállal ellátott átírót is értékesíthet, amelyen keresztül a digitális magnó funkcióit vezéreljük, ami egyben a termelékenységet és a munka kényelmét is növeli. A program egy szabványos hangkártyához, például a Sound Blasterhez való változata is lehetséges.

Következtetés

Jelenleg az AES Szabványügyi Bizottság egy speciális csoportja (P. Mapp elnökletével) nemzetközi ajánlásokat készít a beszédérthetőség értékelésére. Az ebbe a csoportba tartozó szakemberek azonban főként az érthetőség értékelésére szolgáló különféle módszerek összehasonlító elemzésével foglalkoznak.

De ha a beszédérthetőség felmérésének problémája ennyire összetett, akkor miért is beszélünk olyan módszerekről, amelyek automatikusan növelik ezt az érthetőséget! Hiszen a beszéd érthetősége nemcsak objektíven mérhető tényezőktől (zajszint stb.) függ, hanem olyan szubjektív tényezőktől is, mint a nyelvtudás szintje, a beszélő dikciója, a beszélő ismertségének foka. a hallgatót az üzenet tartalmával, hallásának állapotával stb. Látod, bármilyen automatizált, beszéddel működő számítógépes rendszer létrehozása rendkívül nehéz feladat, de mivel sok területen fontos, különösen a fejlesztés szempontjából. A kommunikációs rendszerek piacán, és megoldásában jelentős szakemberek vesznek részt különböző országokban, remélhetjük, hogy egyszer majd megbízható rendszerek születnek a pontos beszédfelismerésre.

CD-ROM-unkon megtalálja a SoundCleaner és a ClearVoice Denoiser demó verzióit.

Halláskárosodás és cerebrovaszkuláris baleset. Tények és ajánlások

A halláskárosodás és a beszédkárosodás gyakori szövődményei az akut vagy krónikus betegségeknek cerebrovaszkuláris balesetek, ami a betegek nagymértékű társadalmi alkalmazkodási rendellenességéhez vezet. A rossz hallás, a beszédérthetőség markáns romlása, a beszédartikulációs zavar, az afázia jelenléte a beteg elszigetelődéséhez vezet nemcsak a társadalomban, hanem a családban is.

Cerebrovaszkuláris baleset az agy idegi struktúráinak visszafordíthatatlan pusztulásához, lényegében halálához vezet az artériás véráramlás és a sejtek oxigénellátásának (oxigéntelítettségének) elégtelensége miatt. Megsértések lehetnek ischaemiás vagy vérzéses karakter.

Ok ischaemia egy olyan érblokk, amely az agyat artériás vérrel látja el.

Hemorrhagiás rendellenesség a vérkeringés az erek felszakadásával és az agyszövet vérzésével jár.

Bármely ilyen típusú érrendszeri rendellenesség tartós romláshoz vagy funkcióvesztéshez vezethet a sérült erek által ellátott agyterületeken. Ennek eredményeként a test különböző szerveinek és rendszereinek neurológiai funkcióinak hiányával van dolgunk, beleértve az érzékszerveket is.

A modern statisztikák szerint a halláskárosodás az agyi érkatasztrófák egyik leggyakoribb következménye. Azonban ezeknek a rendellenességeknek az előfordulását nagymértékben alábecsülik. A fő ok a hallásvesztés viszonylag rejtett természete más nyilvánvalóbb funkcionális rendellenességek hátterében, mint például a nyelési, koordinációs, járási vagy beszédbeli nehézségek. Gyakran a rokonok kommunikációs nehézségekkel kapcsolatos panaszokkal hoznak betegeket, és ezeket a tényeket a verbális (beszéd) kommunikáció nehézségeivel magyarázzák. És csak a körülmények és tünetek részletes tisztázása hozza előtérbe a hallásélesség és a beszédérthetőség csökkenését az élmény után. stroke.

Alapforma halláskárosodás amellyel az agyi érkatasztrófák kialakulása után a betegeknél találkoznak a szakemberek az szenzorineurális hallásvesztés. A jogsértés oka hangérzékelés károsodik a belső fül (cochlea) receptorsejtjei, a vestibulocochlearis ideg halló része vagy az agy temporális régiójában található hallóanalizátor központi pályái és kérgi része. Ezek az eredmények legvalószínűbbek azoknál a betegeknél, akiknek kórelőzményében atherosclerosis szerepel, hosszú ideje dohányoznak, cukorbetegek vagy magas vérnyomásuk van. A szenzorineurális hallásvesztés eseteinek jelentős növekedése figyelhető meg azoknál az embereknél, akiknél több hajlamosító negatív tényező kombinációja áll fenn.

A szélütésen átesett emberek halláskárosodásának okai közül a leggyakoribb az ischaemia. Különösen az anterioinferior cerebelláris artéria infarktusának eseteiről beszélünk, amelyek az összes megfigyelés 83% -át teszik ki. A halláskárosodás ritkábban fordul elő a cerebelláris hátsó alsó inferior infarktusával - az esetek 12% -ában. Az említett példákban a keringési zavar oldalán egyoldalú halláskárosodás megfigyelése a jellemző. Ez egy empirikus szabályhoz vezet: a vérkeringés állapotának kötelező felmérése szükséges minden egyoldalú, szenzorineurális típusú halláskárosodás megfigyeléséhez.

Sokkal ritkábban fordul elő a felső kisagyi artéria infarktusa, amelyet a fej másik oldalán halláskárosodás kísér. A legritkábban előforduló halláskárosodás az agytörzs vagy annak középvonali struktúráinak agyi keringésének károsodása miatt következik be – ez az esetek kevesebb mint 1%-a.

Hemorrhagiás stroke a betegek kisebb részénél halláskárosodáshoz vezethet. Klinikai változatosságuk jellemzi: egy- vagy kétoldali hallásvesztés, a folyamat különböző súlyossági foka az enyhe halláskárosodástól a süketségig. Vannak olyan esetek is, amikor a hallásélesség részlegesen spontán javult a következő hetekben.

A fentiek alapján ezúton szeretném felhívni a keringési zavaron átesett betegeket és hozzátartozóikat azzal a javaslattal, hogy egészségi állapotuk után feltétlenül forduljanak szakorvoshoz (audiológus, fül-orr-gégész) audiológiai vizsgálat céljából. lehetővé tesz. Az időben elvégzett audiometria vagy a hallásfunkció tanulmányozásának objektív módszerei (CSEP, otoakusztikus emisszió, akusztikus reflexek regisztrálása) nem teszik lehetővé a tünetek elmulasztását szenzorineurális halláskárosodásés lehetővé teszi a rehabilitációs intézkedések időben történő végrehajtását jobb prognózissal.
A szakosodott intézmények képzési programokat is tartanak a hozzátartozóknak, hogy segítsék őket a megfelelő erőfeszítések megtételében, és a tudományosan megalapozott és bizonyítottan hatékony pszichológiai, logopédiai, hallókészülék- és szociális segítségnyújtási módszerekre összpontosítva.

érkezett alapján Hessom A (Hess) adatok beszédaudiometriával egyes halláskárosodásban, diszkriminációban vagy beszédérthetőségben szenvedő embereknél lényegesen gyengébbek, mint a tónusos hallás. A fonémikus hallásnak ezt a zavarát „fonetikus regressziónak” nevezte. Gyakoribb idős korban, ideggyulladással vagy időskori halláskárosodással. A tiszta tónusú audiogram a hallás enyhe csökkenését mutatja, amely magas frekvenciákon fokozatosan növekszik, miközben a fonémikus hallás nem megfelelően élesen csökken.

Sokszor ugyanabban az időben betegérrendszeri rendellenességek tünetei vannak. A szerző szerint a fonemikus regresszió megelőzi a mentális aktivitás súlyosabb zavarait, és az agy vérkeringésének részleges zavara okozza. Carhart szerint a fonemikus regresszió a központi süketség jele.

Korai jel kortikális halláscsökkenés az érthető beszédészlelés megsértése mentális stressz, feszültség, valamint zaj interferencia vagy a beszélő dikciójának kisebb hibái esetén. Megállapítottuk, hogy megjelenési idejét tekintve gyakran megelőzi a tiszta hangok érzékelésének érezhető csökkenését. Sok ilyen betegnél csak a C4096 csökkent 10-15 dB-en belül.

Ezt követően a szabálysértést rendesen feljegyezték helyzet. A hallás vizsgálatakor feltárul a beszéd és a hanghallás disszociációja, valamint a hallószerv fokozott fáradtsága. Végül a késői stádiumban, a hanganalizátor rendszeren keresztül a gátlásnak a kéreg alatti csomópontokra való átterjedése miatt a tónusos hallás is romlik.

Artikulált, tiszta hallás, beszédészlelés és -értés a hallásanalizátor kérgi végének legmagasabb funkcióját képviselik. A személyben a beszéd elsajátítása során kialakult ideiglenes kapcsolatok alapján történik a beszéd jeleinek kiemelésével és más nem fontos jelek gátlásával. A beszédhangok rádióberendezések és telefonok általi továbbításának további, még kismértékű torzulása megnöveli az elemzési és szintézis követelményeit, amelyek az agykéreg funkcionális aktivitásának zavara esetén nehezen kezelhetők. Ez magyarázza a nehézségek korai megjelenését a rádióhallgatás, a telefonbeszélgetés stb.

Leromlás beszédérthetőség elsősorban egyszótagú szavakkal kapcsolatban észlelték; Ugyanakkor a két szótagos szavak jó érthetősége továbbra is megmaradhat. Tehát, ha a beteg legfeljebb 1 m távolságból érti az egyszótagú szavakat, akkor körülbelül 5-6 m távolságból hallja a kéttagú szavakat. A betegek panaszkodnak az orvosnak, hogy nehezen hallanak beszédet, és gyakran kérdeznek újra, amit a kimondott és suttogó beszéd tanulmányozása is megerősít; Eközben a hanghang-audiogram teljesen normális lehet. Számos hypertoniás betegnél figyeltünk meg ilyen éles disszociációt a hang- és beszédhallás között.

Hangsúlyozni kell, hogy magas vérnyomásraÁltalában nincs mély zavar a beszéd elemzésében és szintézisében, amint azt az agy bal halántéklebenyének kéregében szenvedő betegeknél megfigyelték. Ha a szavakat elég hangosan mondják ki, az elemzés normálisan történik. Egyes jelentések szerint a magas vérnyomást hyperacusis kíséri - a hallószerv enyhe ingerlékenysége magas hangokra.
Ez különösen abban mutatkozik meg, hogy hangos hangokra a betegek fokozott vérnyomással reagálnak; Ha a betegeket csendes, hangszigetelt helyiségbe helyezik, a nyomás csökken.