Com uma pequena ajuda de tubos de PVC, pesquisadores de Wisconsin enganam alguns sistemas de identificação de voz

2024-01-08 09:00

PVC Piping

Shimaa Ahmed é estudante de doutorado na UW-Madison. Ela investigou se era possível alterar a ressonância, ou vibrações de frequência específica, de uma voz, para derrotar dispositivos automáticos de identificação de locutores.


É possível enganar sistemas de computador que usam a voz de uma pessoa como senha? Alguns engenheiros de Wisconsin dizem que a resposta é sim, e que o fizeram em parte usando tubos de plástico que você pode encontrar em uma loja de ferragens.


Alguns sistemas bancários on-line usam a identificação automática do locutor – em termos mais simples – a voz do titular da conta como senha. Kassem Fawaz, engenheiro elétrico e de computação da UW-Madison, diz que também os usuários do Apple iPhone provavelmente estão familiarizados com o assistente virtual Siri, que responde apenas ao proprietário.


"A razão pela qual a Siri só responde a você é porque eles empregam uma tecnologia chamada identificação de alto-falante. Assim, eles obtêm uma espécie de impressão de voz, semelhante a uma impressão digital, e podem determinar se veio de você ou de outra pessoa. E é assim que o Siri pode garantir que o usuário ou proprietário do telefone esteja falando com ele,"Fawaz diz.


Mas Fawaz e dois Ph.D. da UW-Madison. os alunos fazem parte de um esforço multiuniversitário para melhorar a segurança digital. E assim, eles têm procurado maneiras de enganar os sistemas de computador. Eles e outros já estão trabalhando na clonagem da voz humana e em fazer com que um computador fale como essa pessoa.


Mais recentemente, Fawaz diz que os engenheiros perceberam que poderiam voltar do digital para o analógico para enganar muitos sistemas de identificação de alto-falantes.


"E foi assim que tivemos a ideia de projetar algum tipo de dispositivo analógico que não possui nenhum tipo de eletrônica digital que permita personificar outros,"Fawaz diz.


Ph.D. a estudante Shimaa Ahmed diz que primeiro tentou falar através do tubo de papelão encontrado em muitos rolos de papel toalha, imitando celebridades.


"E funcionou. Quando passei algumas vozes de celebridades por este tubo de papel toalha de cozinha, isso mudou a previsão dessas celebridades,"Ahmed diz.


Eventualmente, Fawaz comprou alguns plásticostubos de PVCdo corredor de peças de encanamento de uma loja de ferragens e a equipe começou a usá-lo.

pvc drain pipe

Kassam Fawaz, professor assistente do Departamento de Engenharia Elétrica e de Computação da Faculdade de Engenharia da Universidade de Wisconsin-Madison, é retratado em um retrato de estúdio em 15 de fevereiro de 2022. Fawaz é um dos doze ganhadores do 2022 Distinguished Teaching Prêmio (DTA). (Foto de Althea Dotzour / UW – Madison)

drain down hose


Fawaz diz que perceberam que os tubos tinham deficiências.


"Os tubos de encanamento normais têm dimensões fixas, certo? Você pode controlar o comprimento cortando-o. Mas você não pode controlar o diâmetro. Para alguns experimentos, precisávamos de tubos com diâmetro especial, que você não encontra na Ace Hardware. Então, o que precisávamos fazer para fabricar esses tubos, e a maneira mais fácil de fabricar os tubos é imprimi-los em 3D,"Fawaz diz.


A equipe recorreu ao então estudante de graduação, agora Ph.D. estudante, Yash Wani, que imprimiu alguns tubos em 3D. Wani diz que o trabalho mudou seu foco acadêmico.


"Foi muito legal, sinceramente, foi assim que acabei fazendo o doutorado. Foi legal o suficiente para eu continuar fazendo isso,"ele diz.


Os pesquisadores desenvolveram um algoritmo, ou instruções rigorosas, que calculavam as dimensões do tubo necessárias para transformar a ressonância – isto é, intensidade e qualidade do tom – de quase qualquer voz para imitar outra.


Em uma gravação, Ahmed leu um conjunto de dados de fala convencional e parecia um pouco com a atriz Lisa Kudrow - você sabe, Phoebe de Amigos.


"Não havia nada na rocha,"foi a leitura. Ahmed também tentou imitar a atriz Kelly Reilly, que está na série de TV Pedra amarela."'Não tenho ideia', respondeu Phillip,"Ahmed disse na gravação.


Não eram imitações exatas. Mas eles foram bons o suficiente para passar pelos filtros de ataque digital de um sistema de autenticação de voz e enganá-lo. Também usando vozes de outros estudantes em seu experimento, os engenheiros da UW-Madison relatam enganar os sistemas de segurança 60% das vezes em um teste de 91 vozes.


Bom o suficiente para escrever um artigo e para Ahmed apresentar as conclusões num simpósio de segurança este mês na Califórnia.


"As pessoas ficaram curiosas para saber como podemos fazer dispositivos como tubos, mas mais complicados, que podemos personificar qualquer pessoa,"Ahmed diz.


Fawaz diz que todos os fabricantes de sistemas de identificação de alto-falantes – Apple, Google, IBM, Microsoft e outros – estão cientes das diversas deficiências de sua tecnologia e estão tentando corrigi-las.


Os financiadores da pesquisa da UW incluem a National Science Foundation e a DARPA – o grande braço de pesquisa do Departamento de Defesa.


Obter o preço mais recente? Responderemos o mais breve possível (dentro de 12 horas)
  • Required and valid email address
  • This field is required
  • This field is required
  • This field is required
  • This field is required