Met een beetje hulp van PVC-buizen kunnen onderzoekers uit Wisconsin enkele stemidentificatiesystemen voor de gek houden
2024-01-08 09:00
Shimaa Ahmed is een PhD-student bij UW-Madison. Ze onderzocht of het mogelijk was om de resonantie, of specifieke frequentietrillingen, van een stem te veranderen, om automatische sprekeridentificatieapparaten te omzeilen.
Is het mogelijk om computersystemen die de stem van een persoon als toegangscode gebruiken voor de gek te houden? Sommige ingenieurs uit Wisconsin zeggen dat het antwoord ja is, en dat ze dit deels hebben gedaan door plastic buizen te gebruiken die je in een bouwmarkt kunt vinden.
Sommige systemen voor online bankieren gebruiken automatische sprekeridentificatie – eenvoudiger gezegd – de stem van de rekeninghouder als toegangscode. UW-Madison Electrical and Computer Engineering Prof. Kassem Fawaz zegt dat ook Apple iPhone-gebruikers waarschijnlijk bekend zijn met de virtuele assistent Siri, die alleen reageert op de eigenaar.
"De reden dat Siri alleen op jou reageert, is omdat ze een technologie gebruiken die sprekeridentificatie wordt genoemd. Ze krijgen dus een soort stemafdruk, die lijkt op een vingerafdruk, en ze kunnen nagaan of deze van jou komt, of van iemand anders. En zo kan Siri ervoor zorgen dat de gebruiker of de eigenaar van de telefoon ermee praat:"zegt Fawaz.
Maar Fawaz en twee UW-Madison Ph.D. studenten maken deel uit van een inspanning van meerdere universiteiten om de digitale veiligheid te verbeteren. En dus hebben ze manieren onderzocht om de computersystemen voor de gek te houden. Zij en anderen hebben al gewerkt aan het klonen van de menselijke stem en het laten spreken van een computer zoals die persoon.
Meer recentelijk zei Fawaz dat de ingenieurs zich realiseerden dat ze konden terugvallen van digitaal naar analoog om veel luidsprekeridentificatiesystemen te misleiden.
"En zo kwamen we op het idee om een soort analoog apparaat te ontwerpen dat geen enkele vorm van digitale elektronica heeft waarmee je je kunt voordoen als anderen."zegt Fawaz.
Ph.D. Studente Shimaa Ahmed zegt dat ze eerst probeerde te praten door de kartonnen koker die in veel papieren handdoekrollen zit, waarmee ze beroemdheden imiteerde.
"En het werkte. Toen ik enkele stemmen van beroemdheden door deze koker van keukenpapier liet gaan, veranderde de voorspelling van die beroemdheden:"zegt Ahmed.
Uiteindelijk kocht Fawaz wat plasticpvc pijpuit het gangpad voor sanitaironderdelen van een ijzerhandel en het team begon dat te gebruiken.
Kassam Fawaz, assistent-professor bij de afdeling Electrical & Computer Engineering van het College of Engineering van de Universiteit van Wisconsin-Madison, is op 15 februari 2022 afgebeeld in een studioportret. Fawaz is een van de twaalf ontvangers van de 2022 Distinguished Teaching Onderscheiding (DTA). (Foto door Althea Dotzour / UW–Madison)
Fawaz zegt dat ze zich realiseerden dat de buizen tekortkomingen vertoonden.
"Normale afvoerbuizen hebben vaste afmetingen, toch? Je kunt de lengte bepalen door deze af te knippen. Maar je hebt geen controle over de diameter. Voor een deel van het experiment hadden we buizen nodig met een speciale diameter, die je niet bij Ace Hardware kunt vinden. Dus wat we moesten doen, deze buizen fabriceren, en de eenvoudigste manier om de buizen te fabriceren is door ze in 3D te printen."zegt Fawaz.
Het team wendde zich tot de toenmalige student, nu Ph.D. student Yash Wani, die een aantal buizen in 3D heeft geprint. Wani zegt dat het werk zijn academische focus heeft veranderd.
"Eerlijk gezegd was het heel gaaf dat ik zo uiteindelijk een Ph.D. Het was cool genoeg voor mij om daarmee door te gaan,"hij zegt.
De onderzoekers ontwikkelden een algoritme, of rigoureuze instructies, dat de pijpafmetingen berekende die nodig waren om de resonantie (dat wil zeggen de toonintensiteit en -kwaliteit) van vrijwel elke stem te transformeren om een andere te imiteren.
In één opname las Ahmed voor uit een conventionele spraakdataset en klonk een beetje als actrice Lisa Kudrow – je weet wel, Phoebe uit Vrienden.
"Er lag niets op de rots,"ging lezen. Ahmed probeerde ook een imitatie van actrice Kelly Reilly, die in de tv-serie zit Geelsteen."'Ik heb geen idee,' antwoordde Phillip,"zei Ahmed op de opname.
Het waren geen exacte imitaties. Maar ze waren goed genoeg om door de digitale aanvalsfilters van een stemauthenticatiesysteem heen te komen en het voor de gek te houden. De technici van UW-Madison gebruiken ook de stemmen van andere studenten in hun experiment en melden dat ze in een test met 91 stemmen de beveiligingssystemen in 60% van de gevallen misleiden.
Goed genoeg om een paper te schrijven en voor Ahmed om de bevindingen deze maand op een beveiligingssymposium in Californië te presenteren.
"Mensen waren nieuwsgierig naar hoe we apparaten als buizen kunnen maken, maar ingewikkelder: we kunnen ons als ieder ander voordoen."zegt Ahmed.
Fawaz zegt dat alle makers van sprekeridentificatiesystemen – Apple, Google, IBM, Microsoft en anderen – zich bewust zijn van de verschillende tekortkomingen van hun technologie en deze proberen op te lossen.
Financiers van het UW-onderzoek zijn onder meer de National Science Foundation en DARPA – de grote onderzoeksafdeling van het ministerie van Defensie.