A OpenAI anunciou a integração de um recurso de visão ao modo de voz avançado do ChatGPT, uma funcionalidade que promete transformar a interação dos usuários com o modelo.
Índice
ToggleCom essa nova ferramenta, assinantes dos planos Plus, Team e Pro podem apontar a câmera do celular para objetos e receber respostas em tempo real.
Esse avanço vai além da simples identificação de itens: o sistema é capaz de interpretar conteúdos exibidos na tela do dispositivo, como explicações sobre menus de configurações ou soluções para problemas matemáticos.
Como funciona o recurso de visão?
Essa funcionalidade utiliza aprendizado de máquina para interpretar imagens capturadas pela câmera do usuário.
Por exemplo, ao apontar a câmera para uma equação escrita em um caderno, o modelo pode explicar a solução passo a passo. Da mesma forma, ao visualizar um menu de configurações em um smartphone, o sistema fornece orientações para alterar ou ajustar as opções de forma intuitiva.
Essa inovação representa um salto no uso de tecnologias interativas, trazendo mais praticidade para o dia a dia.
Vantagens para o público corporativo
Empresas de tecnologia podem explorar esse recurso de múltiplas maneiras.
Ferramentas como ERPs, SaaS e sistemas de gestão, amplamente utilizados no ambiente empresarial, podem se beneficiar diretamente. Por exemplo:
- Suporte técnico otimizado: usuários podem apontar a câmera para mensagens de erro em dispositivos e receber instruções detalhadas de como resolver o problema;
- Capacitação de equipes: funcionários podem usar o recurso para entender rapidamente configurações ou funções de softwares internos, economizando tempo em treinamentos;
- Automação de processos: a interpretação visual pode ser integrada a fluxos automatizados, agilizando tarefas repetitivas.
Disponibilidade e acessibilidade
Atualmente, o recurso está disponível para assinantes dos planos pagos da OpenAI (Plus, Team e Pro), reforçando a aposta da empresa em oferecer funcionalidades premium que agreguem valor ao usuário final.
A expectativa é de que essa tecnologia continue evoluindo, abrindo novas possibilidades para interação e automação.