A „koktélparti probléma” kifejezés egy olyan helyzetet ír le, amikor egy zsúfolt, zajos helyiségben valaki próbál egy beszélgetést követni, miközben a háttérben számos más hang és beszélgetés zavarja a figyelmét. Az emberek lenyűgözően képesek erre, ám a technológia sokáig nem tudta ezt a képességet megismételni. Ez a probléma különösen fontos lehet bizonyítékok felhasználásakor, például a bíróságokon, ahol a háttérzajok gyakran nehezítik a beszélgetések pontos azonosítását és az igazság kiderítését.
Egy úttörő megoldás
Keith McElveen, a Wave Sciences alapítója és technológiai igazgatója, a probléma megoldására koncentrált, miközben az amerikai kormánynak dolgozott egy háborús bűncselekményekkel kapcsolatos ügyben. McElveen és csapata olyan hangfelvételekkel dolgozott, amelyekben több beszélő egyszerre szólalt meg, és meg kellett határozniuk, ki adta ki a parancsot egy tömeggyilkosság végrehajtására. McElveen felismerte, hogy a háttérzajok, különösen más emberek beszéde, különösen nehezen eltávolítható, mivel ezek összefonódnak a kívánt hanggal, és a visszhangok tovább rontják a tisztaságot.
A probléma megoldása az lett, hogy mesterséges intelligencia (MI) segítségével elemezzék a hangforrásokat, és elkülönítsék a kívánt hangot a többi zajtól. A technológia lényege, hogy a hangforrások helyét azonosítja, és kizárja azokat a hangokat, amelyek nem a beszélő helyéről származnak.
Hosszú kutatás és kísérletezés után, a Wave Sciences 2019-ben szabadalmaztatott egy olyan technológiát, amely lehetővé teszi a hangok pontos elkülönítését még zajos környezetben is. Ez a megoldás hasonló a fényképezőgép működéséhez, amikor a kamera a kívánt témára fókuszál, és elmosódik a háttér.
Első alkalmazások bírósági ügyekben
A technológia első jelentős alkalmazása egy amerikai gyilkossági ügyben történt, ahol két bérgyilkost vádoltak egy ember megölésével. Az FBI azt akarta bizonyítani, hogy egy család bízta meg őket, amely egy gyermekelhelyezési vitába keveredett. A bíróság által engedélyezett Wave Sciences algoritmusnak köszönhetően olyan felvételek is elfogadhatóvá váltak, amelyek korábban használhatatlannak bizonyultak volna.
Azóta más kormányzati laboratóriumok, köztük az Egyesült Királyságban is, tesztelték a rendszert, és a technológiát a haditengerészet is használta szonárjelzések elemzésére. A Wave Sciences jelenleg azon dolgozik, hogy a technológiát a mindennapi életben is elérhetővé tegye, például okoshangszórókban, autókban, kiterjesztett valóság eszközökben, és hallókészülékekben is.
A mesterséges intelligencia és a bírósági hangfelvételek
A mesterséges intelligencia már számos más területen is bizonyított a bírósági hangelemzésekben. Terri Armenta, a Forensic Science Academy oktatója szerint a gépi tanulási modellek képesek hangminták elemzésére és beszélők azonosítására, ami különösen hasznos a bűnügyi nyomozások során, amikor hangalapú bizonyítékok hitelességét kell ellenőrizni.
Ezen túlmenően, az MI eszközök képesek a hangfelvételek manipulációit is felismerni, biztosítva ezzel a bizonyítékok integritását.
A Wave Sciences algoritmusának legújabb tesztjei azt is kimutatták, hogy a technológia már két mikrofonnal is képes az emberi fül teljesítményéhez hasonló eredményeket produkálni, sőt, több mikrofon használatával még pontosabb eredményeket ér el. Ráadásul a kutatók felfedeztek néhány érdekességet is: a mesterséges intelligencia által használt matematikai modellek kísértetiesen hasonlítanak az emberi hallás folyamataihoz. Ez arra utal, hogy talán ugyanazokat a matematikai elveket használjuk, mint amiket az MI is alkalmaz a „koktélparti probléma” megoldására.
A Wave Sciences mesterséges intelligenciával működő algoritmusa forradalmasítja a hangfeldolgozást, különösen a bírósági bizonyítékok terén. A technológia lehetővé teszi, hogy akár zajos környezetben is pontosan meghalljuk a kívánt hangokat, és ez a megoldás nem csak a bírósági ügyekben, hanem számos más területen is jelentős előrelépést hozhat. A mesterséges intelligencia fejlődése új lehetőségeket nyit meg a hangalapú elemzésekben és kommunikációban, és a jövőben számos iparágban láthatjuk majd alkalmazását.