Biometriai azonosítási módszerek, tipikus alkalmazások


Kétféle hang alapján történő azonosítás létezik: az egyik magának a hangnak az azonosítása, mely a beszélőre egyedileg jellemző ("speaker recognition"). Alapjában véve a hang milyensége genetikus eredetű, léguti lágy szövetek, a hangszál, és a léguti geometria adja a hang eredő személyes jellemzőit., de azokat olyan sok egyéb élettani és viselkedési tényező befolyásolja, hogy mindinkább a viselkedési jellemzők között tárgyalják.
Megkülönböztethetünk két alapvető azonosítási helyzetet:
Közelről max. 1 méterről történő azonosítás. Ennél ellenőrizhetőek a körülmények, az azonosítás lehet multimodusú, pl. arccal kiegészített. A felvétel minősége zajmentes, egyszóval optimálisak a körülmények.
A másik a távolról történő azonosítás (és éppen ennek lehetőségében egyedülálló a hang), de ott más multimodusú lehetőség nincs. Ilyenkor általában tudásalapú (knowledge based) azonosítással növelik a biztonságot (kérdésekre kell válaszolni). Itt az adatátviteli vonal zaja adja a további nehézséget..
A jelenlegi kutatások alacsony minőségű felvételek szövegfüggetlen azonosításra összpontosítanak.
Az azonosítás első szintje a spektrum analízis: milyen frekvenciájú hangok vannak egyáltalán, ezt nevezik a low levelnek. A high level pedig a prozódiai jellemzők: ritmus, sebesség, hanglejtés, hangszín (moduláció), hanghordozás (intonáció), aztán a személyes, nevelési hatások:, és szemantikai, egyéni nyelvhasználat, kiejtés, hóbort, a születési helyre utaló jellemzők, szociális-gazdasági helyzet, képzettségi szinvonal,. Ezeket keresésre is lehet használni, valamint lehallgatásra.
két hangspektrum összehasonlítása