Cingapura – Receber uma carona para o seu destino ficou mais fácil para o Sr. Peter Lim Em junho, depois que Grab lançou um assistente de voz alimentado pela Intelligence Artificial (AI) em seu aplicativo.

Lim, que é deficiente visual, recebeu esse desenvolvimento, pois significava que ele poderia reservar um passeio simplesmente usando sua voz.

No entanto, o Operador de call center de 59 anos Disse que reservar uma carona para alguns lugares, como a Kalidasa Avenue e Lim Ah Pin Road, ainda representa um desafio.

O assistente de voz às vezes tem problemas para entender os padrões de fala de Cingapura, então o Sr. Lim às vezes dá apenas o código postal de seu destino.

Reconhecendo isso, Grab lançou uma chamada aberta no final de junho para amostras de voz de seus usuários

Para ajustar seu modelo de IA.

Construído em Openai GPT-4.1 grande modelo de linguagem e ajustado com 80.000 Amostras de voz fornecidas por funcionários da Grab, a precisão do modelo na compreensão de sotaques de Cingapura e nomes de lugares já está 89 %.

Mas é preciso fazer um trabalho adicional para explicar as inúmeras maneiras pelas quais os locais em Cingapura podem ser pronunciados.

Por exemplo, Hougang pode ser articulado com ou sem a letra “H”, enquanto Clementi pode ser pronunciado como “Kle-man-tee” ou “Klair-Men-Tee”.

Embora não haja alvo definido em quantas amostras de voz Grab deseja coletar até 31 de dezembro, ele pretende trazer a precisão 95 Por cento, disse um porta -voz do Grab ao Sunday Times.

“Isso envolve ter uma variedade e volume de amostras de voz que vocalizam locais de interesse em diferentes arremessos, tons, sotaques e estilos”, disse o porta -voz.

O topo 85 Os locais mais comumente selecionados em Cingapura foram escolhidos para as amostras de voz convidadas dos usuários.

“Os participantes receberão uma seleção randomizada de locais de interesse desta lista para que eles vocalizem os nomes de acordo”, disse o porta -voz.

A empresa já recebeu quase 10.000 gravações de voz de usuários.

O assistente de voz tem sido útil, especialmente quando combinado com a capacidade do aplicativo de sugerir locais possíveis que o usuário possa querer ir em diferentes momentos do dia, disse Lim.

Foto ST: Gavin Foo

Wallich Manor, 80 Dunbar Walk e 31 Jalan Mutiara Latitude estavam entre os locais que esse repórter da ST foi convidado a registrar -se dizendo para melhorar o reconhecimento de padrões de fala no aplicativo.

O assistente de voz tem sido útil, especialmente quando combinado com a capacidade do aplicativo de sugerir locais possíveis que o usuário possa querer ir em diferentes momentos do dia, disse Lim.

“Isso me perguntará se eu quero ir para casa ou se quero ir à igreja nas manhãs de domingo. Se eu disser não, posso dizer para onde quero ir”, acrescentou.

“É cerca de 90 % preciso para me entender até agora.”

O AI Voice Assistant está disponível para usuários com o recurso Talkback ativado em seus telefones.

Os membros da Associação de Cingapura de Handicapped (SAVH) participaram de discussões em grupos focais e estavam envolvidos no teste do recurso antes de ser lançado.

Lyn Loh, que lidera o Departamento de Serviços de Acessibilidade da SAVH, disse que o assistente de voz inicialmente não foi muito receptivo quando recebe comandos de voz durante a fase de teste. Foram necessárias algumas tentativas para entender o que ela estava dizendo.

“Mas agora é muito melhor”, disse Loh.

O recurso será muito útil se puder ser usado para solicitar a entrega de alimentos por meio do aplicativo, disse Loh, que acrescentou que deu feedback para entender isso.

Durante a pandemia Covid-19, ela teve que aprender a pedir comida, pois não podia ver as marcas coladas em pisos e assentos que ditavam onde as pessoas podiam fazer fila e sentar.

“Nunca sabemos quando a próxima pandemia acontecerá”, disse Loh.

O assistente de voz tem problemas às vezes compreendendo os padrões de fala de Cingapura.

Foto ST: Gavin Foo

Grab também testou o desempenho do recurso durante a fase de desenvolvimento, comparando -o a Meralion

Um modelo de IA que pode entender pelo menos oito idiomas regionais

e singlish – desenvolvido pelo A*Star Institute for Infocomm Research.

“Embora os dois modelos sejam projetados para usuários de língua singlish, Meralion se concentra no entendimento da linguagem natural, enquanto o assistente de voz de Grab é adaptado especificamente para ajudar os usuários a identificar locais e pontos de interesse em Cingapura”, disse o porta-voz de Grab.

As gravações coletadas são criptografadas e armazenadas por um ano em um servidor seguro e não estão vinculadas a nenhum identificador pessoal, como o nome do usuário ou o número de celular, disse o porta -voz.

Lim e Loh expressaram esperança de que esse assistente de voz ajude não apenas os deficientes visuais, mas também os idosos e as pessoas com deficiência física.

“Se for melhorado, pode ajudar muitas outras pessoas que apenas querem conversar e não digitar”, disse Lim.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui