A era da Inteligência Artificial já chegou, e a propaganda em torno do novo chatbot, ChatGPT, não nos deixa esquecer isso. Este chatbot de IA gerador de texto, capaz de produzir interação humana com seus usuários, tem causado alvoroço no mundo tecnológico desde seu lançamento no final do ano passado. A tecnologia GPT foi desenvolvida pela OpenAI, uma das muitas empresas cofundadas por Elon Musk – e abandonada por ele em 2018.
A capacidade do ChatGPT de replicar a interação humana, embora com limitações bem documentadas, mostra que há potencial nos sistemas de IA conversacional. Seu sucesso levou empresas como Google e Meta a acelerar seus próprios grandes modelos de linguagem (LLM na sigla em inglês) – Bard e LlaMA, respectivamente – à medida em que a corrida pelo domínio da IA ganha impulso.
O papel da Microsoft no desenvolvimento do GPT
O desenvolvimento do ChatGPT deslanchou após o financiamento da Microsoft em 2019 – a OpenAI recebeu um investimento de um bilhão de dólares que deu à Microsoft direitos exclusivos de licenciamento do GPT-3. O investimento foi parte de uma parceria contínua entre as duas companhias que também envolve o uso da Azure, uma plataforma de computação em nuvem desenvolvida pela Microsoft para treinar seus programas de IA.
Além disso, a Microsoft também anunciou recentemente outro investimento de 10 bilhões de dólares no OpenAI depois de ver o sucesso inicial do ChatGPT em 2022. A parceria permite à Microsoft implantar a tecnologia da OpenAI em suas plataformas como Bing e Azure. A Microsoft também relatou a criação de novas experiências de IA ao testar o GPT-3 em seus robôs.
Os testes da Microsoft com o GPT
O GPT tem agitado o mercado de IA mais do que qualquer outro robô nos últimos anos. Desde ajudar a transformar o atendimento ao cliente dos melhores cassinos online, passando por inspirar novas ideias de teste A/B para os profissionais de marketing digital até encontrar e corrigir erros em códigos de desenvolvedores, o GPT tem tudo para ter um impacto gigantesco nas indústrias em todos os setores.
A Microsoft foi um passo adiante usando o ChatGPT para ajudar a resolver os desafios enfrentados pela indústria robótica. Em seu relatório técnico lançado recentemente, eles afirmam acreditar que o ChatGPT pode ser usado para preencher a lacuna na interação homem-robô no mundo físico. Por exemplo, eles examinaram a capacidade do ChatGPT de gerar códigos e escrever comandos para robôs, assim como monitorar seu desempenho.
Listamos abaixo algumas de suas descobertas.
Manipulação de um braço robótico
Os desenvolvedores ensinaram um braço robótico a realizar tarefas complexas como empilhar blocos usando o código gerado pelo ChatGPT. Ele permitiu ao robô empilhar blocos de madeira para formar um logotipo da Microsoft.
Neste caso, o ChatGPT sacou o logotipo da Microsoft de sua biblioteca, desenhou-o em forma de código, e então, através do feedback conversacional, descobriu como compor o logotipo em forma física usando as interfaces de programação existentes do robô.
O GPT controlando um drone
O principal problema da robótica hoje em dia é que você precisa ter conhecimentos em linguagens de programação complexas para poder interagir facilmente com sistemas robóticos. O estudo de caso descobriu que o ChatGPT pode ser uma boa ligação entre um usuário sem conhecimentos técnicos e um drone. O usuário simplesmente emitiu instruções, e o GPT desenvolveu o código necessário para executar. Por exemplo, eles instruíram o drone a tirar uma fotografia de si mesmo em uma superfície refletiva e a inspecionar prateleiras em ziguezague.
O GPT e o simulador AirSim
O AirSim da Microsoft é um simulador para carros sem motorista, drones e muito mais. Ele permite aos usuários interagir com os veículos autônomos em uma simulação. É possível escrever e testar o código no simulador, algo que a Microsoft queria testar usando o ChatGPT.
O LLM do ChatGPT resolveu vários enigmas e permitiu que os desenvolvedores da Microsoft controlassem o drone sem muita interferência de sua parte. Por exemplo, o ChatGPT foi capaz de escrever e executar código que permitiu ao drone encontrar uma bebida com base em descrições de quão saudável ela é.
Mais impressionante ainda, o ChatGPT escreveu blocos de construção que permitiram que o drone passasse em um teste para evitar obstáculos aéreos.
Estes experimentos mostram que o ChatGPT poderia ser usado além de fornecer texto conversacional. A Microsoft já criou o PromptCraft, uma plataforma de código aberto que permite aos desenvolvedores testar o código gerado pelo ChatGPT em simuladores robóticos como o AirSim.
O ChatGPT já mostrou sua capacidade como um poderoso modelo para completar textos acadêmicos e tarefas de casa, escrever músicas e criar layouts de páginas de internet a partir de código simples. Entretanto, a capacidade de controlar robôs – embora após uma análise cuidadosa do código – poderia ser pioneira no paradigma robótico.