O CEO do Google Sundar Pichai foi entrevistado pelo Decoder (midia que pertence ao portal The Verge nos EUA) em maio de 2024 para falar sobre os maiores avanços em Inteligência Artificial, o futuro da busca no Google e o destino da web.
Hoje, estou conversando com o CEO da Alphabet e do Google, Sundar Pichai, que participou do programa um dia após a conferência de desenvolvedores Google I/O da semana passada (em maio de 2024). O foco do Google durante a conferência foi, claro, a IA — o Google está incorporando Inteligência Artificial em praticamente todos os seus produtos. Meu favorito pessoal é a nova busca com IA no Google Fotos, que permite perguntar coisas como: "Qual é o número da minha placa?" e obter uma resposta de toda a sua biblioteca de fotos. No total, os executivos do Google disseram "IA" mais de 120 vezes durante a apresentação — nós contamos.
Mas houve um anúncio específico no I/O que está causando um impacto enorme na web: o Google está lançando o que chama de "Visões Gerais com IA" na Busca para todos nos Estados Unidos nesta semana e, até o final do ano, para mais de um bilhão de usuários ao redor do mundo. Isso significa que, quando você pesquisar algo no Google, obterá resultados impulsionados por IA no topo da página para várias consultas. A empresa literalmente descreve isso como "deixar o Google fazer a busca por você." O Google vem testando isso há um ano no que chamou de "Experiência de Geração de Busca", então você já pode ter visto uma versão disso — mas agora está aqui, e vai mudar a web como a conhecemos.
Até agora, o ecossistema do Google era baseado em links para o conteúdo de outras pessoas: você digitava algo na caixa de pesquisa, via alguns links e clicava em um. Isso enviava tráfego para sites, que seus donos podiam tentar monetizar de várias maneiras, e idealmente, todos ganhavam.
O Google é, de longe, a maior fonte de tráfego na web hoje, então, se começar a manter esse tráfego para si, respondendo perguntas com IA, isso mudará ou até mesmo destruirá o ecossistema da internet como o conhecemos. A News/Media Alliance, que representa um grupo de grandes publicadores de notícias, divulgou um comunicado chamando as pré-visualizações com IA na busca de "catastróficas para nosso tráfego".
Se você é um ouvinte do Decoder, já me ouviu falar sobre essa ideia muitas vezes no último ano: eu a chamo de Google Zero, e venho perguntando a CEOs da web e da mídia o que aconteceria com seus negócios se o tráfego do Google fosse reduzido a zero. Se chatbots de IA e resultados de busca alimentados por IA estiverem resumindo tudo para você, por que você iria a um site? E se todos nós pararmos de visitar sites, qual será o incentivo para colocar novo conteúdo na web? O que impedirá personagens duvidosos de inundar a web com spam gerado por IA para tentar manipular esses sistemas? E se conseguirmos sufocar a web com IA, o que todos esses bots irão resumir quando as pessoas fizerem perguntas?
Sundar tem algumas ideias. Para começar, ele não está convencido de que a web, que ele diz se importar profundamente, esteja em tanto perigo assim. Você o ouvirá mencionar a famosa manchete da Wired de 2010, "A web está morta", e ele argumenta que novas tecnologias transformadoras, como a IA, sempre causam algumas interrupções de curto prazo.
Ele diz que injetar IA na Busca trata-se de criar valor para os usuários, e esses usuários estão dizendo a ele que acham esses novos recursos úteis — e até clicam nos links em taxas mais altas nas pré-visualizações de IA. Mas ele não disse onde isso deixa as pessoas que colocam o conteúdo na internet em primeiro lugar. Realmente nos aprofundamos nessa ideia por um tempo — e falamos muito sobre a raiva que os criadores sentem em relação aos sistemas de IA que estão sendo treinados com o trabalho deles.
Conversei bastante com Sundar nos últimos anos, e essa foi a vez em que o vi mais entusiasmado. Dá para perceber que há uma tensão profunda entre a visão que o Google tem para o futuro — onde a IA magicamente nos torna mais inteligentes, produtivos e artísticos — e os medos e ansiedades muito reais que criadores e donos de sites estão sentindo agora sobre como a busca mudou e como a IA pode engolir a internet para sempre. Sundar está lidando com essa tensão.
Uma observação: você me ouvirá dizer que acho que Sundar continua fazendo referências indiretas à OpenAI, o que ele contesta com bastante veemência. Pensei sobre isso depois, e está bem claro que ele não estava falando apenas da OpenAI, mas também da Meta, que explicitamente deixou de enviar tráfego para qualquer site e deixou claro que não quer apoiar notícias em suas plataformas. Gostaria que tivesse me ocorrido durante essa conversa, pois teria perguntado mais diretamente sobre isso.
Ok, Sundar Pichai, CEO do Google. Vamos lá.
Sundar Pichai, você é o CEO da Alphabet e do Google. Bem-vindo ao Decoder.
Nilay, é bom estar aqui.
Estou animado para entrevistar você. Sinto que converso com você todos os anos no Google I/O e falamos sobre todas as coisas que você anunciou. Há muitas notícias sobre IA para discutir. Como você sabe, estou particularmente interessado no futuro da web, então realmente quero falar sobre isso com você, mas pensei em começar com uma pergunta mais fácil.
Você acha que linguagem é a mesma coisa que inteligência?
Uau, essa não é uma pergunta fácil! Eu não acho que sou o especialista nisso. Acho que a linguagem realmente codifica muita inteligência, provavelmente mais do que as pessoas pensavam. Isso explica, em grande parte, os sucessos dos grandes modelos de linguagem. Mas minha intuição me diz que, como humanos, há muito mais na maneira como consumimos informações do que apenas a linguagem. Mas eu diria que a linguagem é muito mais do que as pessoas pensam que é.
A razão pela qual fiz essa pergunta para começar é: olho para os anúncios do I/O sobre IA e o que você está fazendo, olho para os seus concorrentes com IA e o que eles estão fazendo, e tudo é muito focado em linguagem. São os LLMs que realmente levaram a essa explosão de interesse em inovação e investimento, e me pergunto se a inteligência está aumentando na mesma proporção que a facilidade com a linguagem. Para ser totalmente honesto, eu meio que não vejo isso. Vejo os computadores melhorando muito na linguagem e, na verdade, em alguns casos, ficando mais burros. Estou me perguntando se você vê essa mesma lacuna.
Sim, é uma ótima pergunta. Parte da razão pela qual fizemos o Gemini nativamente multimodal — e você já está começando a ver alguns vislumbres disso agora, mas ainda não chegou completamente aos produtos — é para que, com áudio, vídeo, texto, imagens e código, quando tivermos a multimodalidade funcionando no lado de entrada e saída — e estamos treinando modelos usando tudo isso — talvez no próximo ciclo, isso encapsule muito mais do que apenas hoje, que é principalmente baseado em texto. Eu acho que esse continuum vai mudar à medida que absorvemos muito mais informações dessa maneira. Então, talvez haja mais por vir.
No ano passado, o slogan era "Ousado, mas responsável". Essa é a abordagem do Google. Você o repetiu no palco este ano. E então eu olho para nossas reações quando a IA comete erros, e parece que elas estão se tornando cada vez mais moderadas com o tempo.
Vou te dar um exemplo. Nas demonstrações que você fez ontem, mostrou uma busca multimodal em vídeo de alguém tentando consertar uma câmera de filme quebrada. E a resposta estava simplesmente errada. A resposta que foi destacada no vídeo foi: "Basta abrir a parte de trás da câmera de filme e balançá-la." É como se, bem, isso arruinaria todo o seu filme. Ninguém que tivesse um entendimento inteligente de como aquela câmera [funcionava] sugeriria isso.
Eu estava conversando com a equipe e, ironicamente, como parte da produção do vídeo, eles consultaram vários especialistas no assunto que revisaram a resposta e acharam que estava tudo bem. Eu entendo a nuance. Concordo com você. Obviamente, você não quer expor seu filme tirando-o de um quarto escuro. Existem certos contextos em que isso faz sentido. Se você não quer quebrar a câmera e se o que você capturou não é tão valioso, faz sentido fazer isso.
Você está certo. Há muita nuance nisso. Parte do que espero que a Busca sirva é para te dar muito mais contexto ao redor dessa resposta e permitir que as pessoas a explorem profundamente. Mas eu acho que essas são as coisas que precisamos continuar melhorando. Mas, em resposta à sua pergunta anterior, veja, eu realmente vejo a fronteira de capacidade continuando a avançar. Acho que estamos um pouco limitados se estivermos apenas treinando com dados de texto, mas todos nós estamos tornando isso mais multimodal. Portanto, vejo mais oportunidades por aí.
Vamos falar sobre a Busca. Essa é a coisa que mais me interessa — eu acho que é a coisa que está mudando mais. De uma forma abstrata, é a coisa mais empolgante. Você pode fazer uma pergunta a um computador e ele simplesmente vai te dar uma resposta. Isso parece novo. Vejo a empolgação em torno disso.
Ontem, você anunciou que as Visões Gerais com IA estão chegando à Busca. Isso é uma extensão do que era chamado de Experiência de Geração de Busca, que foi anunciado para todos nos Estados Unidos. Eu descreveria as reações a essa notícia por parte das pessoas que fazem sites como fundamentalmente apocalípticas. O CEO da News/Media Alliance disse à CNN: "Isso será catastrófico para o nosso tráfego." Outro CEO da mídia me encaminhou um boletim informativo e a manchete era: "Isso é um golpe fatal para os editores." Você esperava esse tipo de resposta ao lançar as Visões Gerais com IA na Busca?
Eu me lembro, em 2010, havia manchetes dizendo que a web estava morta. Eu trabalho há muito tempo na web, obviamente. Eu me importo profundamente com isso. Quando a transição de desktop para mobile aconteceu, havia muita preocupação porque as pessoas estavam dizendo: "Ah, é uma tela pequena. Como as pessoas vão ler conteúdo? Por que elas olhariam para o conteúdo?" Começamos a introduzir o que chamávamos internamente de "Respostas da Web" em 2014, que são os trechos destacados fora [da lista de links]. Então, você tinha perguntas assim.
Eu continuo otimista. Empiricamente, o que estamos vendo ao longo dos anos é que a curiosidade humana é ilimitada. É algo que entendemos profundamente na Busca. Mais do que qualquer outra empresa, nos diferenciaremos em nossa abordagem mesmo através dessa transição. Como empresa, reconhecemos o valor desse ecossistema, e é simbiótico. Se não houver um ecossistema rico criando conteúdo único e útil, o que você está reunindo e organizando? Portanto, sentimos isso.
Eu diria que, através de todas essas transições, as coisas se desenrolaram de forma um pouco diferente. Eu acho que os usuários estão procurando conteúdo de alta qualidade. A parte contra-intuitiva, que eu acho que quase sempre se concretiza, é [que] não é um jogo de soma zero. As pessoas estão respondendo de forma muito positiva às Visões Gerais com IA. É uma das mudanças mais positivas que já vi na Busca com base em métricas. Mas as pessoas realmente se afastam disso. E quando você dá contexto, elas realmente se afastam disso. Isso ajuda elas a entenderem, e assim elas também se envolvem com o conteúdo abaixo. Na verdade, se você colocar conteúdo e links dentro das Visões Gerais com IA, eles obtêm taxas de cliques mais altas do que se você os colocar fora das Visões Gerais com IA.
Mas eu entendo o sentimento. É uma grande mudança. Esses são momentos disruptivos. A IA é uma grande mudança de plataforma. As pessoas estão projetando o futuro e investindo muito na criação de conteúdo. São os negócios delas. Então, entendo a perspectiva e não estou surpreso. Estamos interagindo com muitos atores, tanto direta quanto indiretamente, mas continuo otimista sobre como isso realmente se desenrolará. Mas é uma boa pergunta. Estou feliz em falar mais sobre isso.
Eu tenho esse conceito que chamo de “Google Zero”, que nasce da minha própria paranoia. Cada remetente que o The Verge já teve subiu e depois caiu, e o Google é o último remetente de tráfego em grande escala na web para quase todos os sites agora. E posso ver que, para muitos sites, o Google Zero está se concretizando. O tráfego do Google deles foi a zero, particularmente em sites independentes que não fazem parte de algum grande conglomerado de publicação. Há um blog sobre purificadores de ar que cobrimos chamado HouseFresh. Há um site de jogos chamado Retro Dodo. Ambos esses sites disseram: “Olha, nosso tráfego do Google foi a zero. Nossos negócios estão condenados.”
Esse é o resultado certo aqui em tudo isso — que as pessoas que se importam tanto com videogames ou purificadores de ar que começaram sites e criaram conteúdo para a web são as que mais estão se prejudicando nessa mudança de plataforma?
É sempre difícil falar sobre casos individuais, e no final do dia, estamos tentando satisfazer as expectativas dos usuários. Os usuários estão votando com os pés, e as pessoas estão tentando descobrir o que é valioso para elas. Estamos fazendo isso em grande escala, e não posso responder sobre um site específico—
Um monte de pequenos jogadores está sentindo a dor. Eles estão dizendo claramente: “Nossos negócios estão acabando.” E essa é a coisa que você está dizendo: “Estamos interagindo, estamos conversando.” Mas isso está acontecendo de forma muito clara.
Não está claro para mim se essa é uma tendência uniforme. Eu tenho que olhar os dados de forma agregada, então, anedoticamente, sempre há momentos em que as pessoas vêm em uma área e dizem: “Eu, como um site específico, estou indo pior.” Mas é como um restaurante individual dizendo: “Comecei a receber menos clientes este ano. As pessoas pararam de comer comida,” ou o que quer que seja. Não é necessariamente verdade. Outro restaurante pode ter aberto ao lado e estar indo muito bem. Portanto, é difícil dizer.
Do nosso ponto de vista, quando olho historicamente até mesmo na última década, fornecemos mais tráfego para o ecossistema e impulsionamos esse crescimento. Você pode estar fazendo um ponto secundário sobre sites pequenos versus sites mais agregadores, que é o segundo ponto que você está falando. Ironia das ironias, há momentos em que fizemos mudanças para realmente enviar mais tráfego para os sites menores. Alguns desses sites que reclamam muito são os agregadores no meio. Portanto, o tráfego deve ir para o restaurante que criou um site com seus menus e coisas ou para pessoas escrevendo sobre esses restaurantes? Essas são perguntas profundas. Não estou dizendo que há uma resposta certa.
Mas você está prestes a virar todo o carro de maçãs, certo? Você está prestes a começar a responder algumas dessas perguntas de maneira muito direta. E de onde esse conteúdo virá no futuro, acho que você quer que as pessoas que se importam mais publiquem essas informações diretamente para serem sintetizadas.
Eu concordo.
Os incentivos para isso parecem estar ficando cada vez menores — na web, de qualquer forma.
Sinto que é o oposto. Se algo, sinto que, por meio das Visões Gerais com IA, quando você dá contexto às pessoas, sim, há momentos em que tudo o que as pessoas querem é uma resposta rápida e elas saem. Mas, no geral, quando olhamos para as jornadas dos usuários, quando você dá o contexto, isso também expõe as pessoas a pontos de partida, e assim elas se envolvem mais. Na verdade, isso é o que impulsiona o crescimento ao longo do tempo. Eu olho para a transição de desktop para mobile e havia perguntas semelhantes. Na verdade, havia uma capa de [revista] que estou quase tentado a puxar, dizendo: “A web está morta.” Havia um argumento do Google Zero há 10 anos. Mas você mesmo fez a observação de que não é por acaso que ainda somos um dos maiores remetentes porque nos importamos profundamente com isso há muito, muito tempo.
Eu olho para nossa jornada, mesmo no ano passado, através da Experiência de Geração de Busca, e constantemente nos encontramos priorizando abordagens que enviariam mais tráfego enquanto atendem às expectativas dos usuários. Pensamos profundamente sobre isso e realmente mudamos nossa abordagem. Se há áreas em que sentimos que não conseguimos acertar totalmente, somos cuidadosos ao implementá-las. Mas acho que o que nos surpreende positivamente é que as pessoas se envolvem mais, e isso levará a mais crescimento ao longo do tempo para conteúdo de alta qualidade.
Há muito debate sobre o que é conteúdo de alta qualidade. Pelo menos na minha experiência, valorizo fontes independentes, valorizo coisas menores, quero vozes mais autênticas. E acho que essas são características importantes que estamos constantemente tentando melhorar.
Você mencionou que acha que mais pessoas vão clicar nos links nas Visões Gerais com IA. Liz [Reid], que dirige a Pesquisa, fez uma postagem no blog fazendo a mesma afirmação. Não há dados públicos que comprovem que isso é verdade ainda. Você vai liberar esses dados? Você vai mostrar às pessoas que isso realmente está acontecendo?
De forma agregada, eu acho que as pessoas confiam nesse valor do ecossistema. Se, ao longo do tempo, as pessoas não veem valor, e os proprietários de sites não veem retorno do Google, acho que pagaremos um preço. Temos a estrutura de incentivos certa. Mas, obviamente, veja, somos cuidadosos... há muitas variações individuais, e algumas delas são os usuários escolhendo qual caminho seguir. Essa parte é difícil de resolver. Mas eu realmente acho que estamos comprometidos em um nível agregado a fazer a coisa certa.
Esta manhã, eu estava lendo algumas publicações comerciais da comunidade de SEO respondendo às mudanças, e uma das coisas que foi apontada foi que, no Search Console, não mostra se os cliques estão vindo de um snippet em destaque ou de uma Visão Geral com IA ou apenas dos 10 links azuis normais do Google. Você quebraria isso? Você se comprometeria a separar isso para que as pessoas possam realmente auditar, verificar e medir que as Visões Gerais com IA estão enviando tanto tráfego quanto você diz que estão?
É uma boa pergunta para a equipe de Pesquisa. Eles pensam sobre isso em um nível mais profundo do que eu. Acho que estamos constantemente tentando dar mais visibilidade, mas também queremos que as pessoas criem conteúdo que seja bom. E estamos tentando classificá-lo e organizá-lo, então acho que há um equilíbrio a ser alcançado. Quanto mais especificamos, mais as pessoas projetam para isso. Há um compromisso aí, então não está claro para mim qual é a resposta certa.
Esse compromisso entre o que você especifica e diz e o que as pessoas fazem, tem sido a história da web por bastante tempo. Atingiu, eu acho, um estado estacionário. Se você achou que esse estado estacionário era bom ou ruim, pelo menos era um estado estacionário. Agora, esse estado está mudando — a IA está, obviamente, mudando isso.
O modelo dos 10 links azuis, o antigo estado estacionário, baseia-se muito em uma troca: “Vamos deixar você indexar nosso conteúdo. Vamos [ter] snippets em destaque. Vamos deixar você ver todas as nossas informações. Em troca, você nos enviará tráfego.” Isso formou a base do que você poderia chamar de um argumento de uso justo. O Google vai indexar essas coisas, e não haverá muitos pagamentos no meio.
Na era da IA, ninguém sabe como isso vai se desenrolar. Há alguns grandes processos judiciais em andamento. Há acordos sendo feitos pelo Google e pela OpenAI para dados de treinamento. Você acha apropriado que o Google comece a fazer mais acordos para pagar por dados para treinar os resultados de busca? Porque esses snippets de IA não são realmente os mesmos que os 10 links azuis ou qualquer outra coisa que você tenha feito no passado.
Para ser muito claro, há um mito de que a pesquisa do Google tem sido de 10 links azuis por — eu olho para nossa experiência mobile — muitos, muitos anos. E tivemos respostas, permitimos que você refinasse perguntas, tivemos snippets em destaque, e assim por diante. O produto evoluiu significativamente.
Dito isso, como empresa, mesmo enquanto olhamos para a IA, fizemos o Google [News] Showcase, fizemos acordos de licenciamento. Na medida em que há valor ali, obviamente achamos que há um caso para uso justo no contexto de uso benéfico e transformador. Não vou argumentar isso com você, dado seu histórico. Mas acho que há casos em que veremos valor incremental dedicado para nossos modelos, e estaremos buscando parcerias para conseguir isso. Eu realmente acho que vamos abordar dessa maneira.
Deixe-me fazer essa pergunta de uma maneira diferente. Não vou fazer muita análise de uso justo com você, prometo, tanto quanto gosto de fazer isso.
Houve alguns relatos recentes de que a OpenAI treinou seu produto de geração de vídeo, Sora, no YouTube. Como você se sentiu ao ouvir essa notícia?
Olha, não sabemos os detalhes. Nossa equipe do YouTube está acompanhando e tentando entender. Temos termos e condições, e esperaríamos que as pessoas respeitassem esses termos e condições ao construir um produto, então é assim que me senti em relação a isso.
Então você sentiu que eles potencialmente quebraram seus termos e condições? Ou, se eles quebraram, isso não seria apropriado?
Isso mesmo.
A razão pela qual fiz essa pergunta — que é uma pergunta muito mais emocional — é que, ok, talvez isso não seja apropriado. E o que a OpenAI disse é essencialmente “Treinamos com informações disponíveis publicamente”, o que significa que elas encontraram na web.
A maioria das pessoas não consegue fazer esse acordo. Elas não têm uma equipe do YouTube de profissionais de licenciamento que pode dizer: “Temos termos e condições.” Elas nem mesmo têm termos e condições. Elas estão apenas colocando suas coisas na internet. Você entende por que, emocionalmente, há essa reação da comunidade criativa em relação à IA — que se sente a mesma coisa que você pode ter sentido sobre a OpenAI treinando no YouTube?
Absolutamente. Veja, sejam proprietários de sites, criadores de conteúdo ou artistas, eu posso entender quão emocional é essa transformação. Parte da razão pela qual você viu, até mesmo durante o Google I/O, quando estávamos trabalhando em produtos como geração de música, realmente adotamos uma abordagem em que estamos trabalhando primeiro para fazer ferramentas para artistas. Não lançamos uma ferramenta de uso geral para qualquer pessoa criar músicas.
A maneira como adotamos essa abordagem em muitos desses casos é colocar a comunidade criativa o mais no centro possível. Já fizemos isso há muito tempo com o YouTube. Através de tudo isso, estamos tentando descobrir quais são as maneiras certas de abordar isso.
Mas é um momento transformador também, e há outros jogadores nisso. Não somos o único jogador no ecossistema. Mas, em relação à sua pergunta anterior, sim, entendo as emoções das pessoas a respeito disso. Eu definitivamente sou muito empático em relação a como as pessoas estão percebendo esse momento.
Eles sentem que é uma apropriação — que colocam trabalho na internet e as grandes empresas vêm, pegam isso de graça e, em seguida, criam produtos pelos quais estão cobrando 20 dólares por mês ou que vão elevar seu trabalho criativo e remixá-lo para outras pessoas. O que faz isso parecer uma apropriação é [que] muito pouco valor retorna para eles.
Essa é realmente a questão que estou perguntando: como você traz valor de volta para eles? Como você traz incentivos de volta para o pequeno criador ou o negócio independente que está dizendo: “Olha, isso parece uma apropriação”?
Olha. [Suspiro] A razão pela qual fomos bem-sucedidos em plataformas como o YouTube é que trabalhamos duro para responder a essa pergunta. Você continuará a nos ver se aprofundar sobre como fazer isso bem. E eu acho que os players que acabam se saindo melhor aqui terão mais estratégias vencedoras ao longo do tempo. Eu realmente acredito nisso.
Em tudo que fazemos, precisamos resolver isso. Sempre que você está gerenciando uma plataforma, é a base sobre a qual você pode construir uma plataforma sustentável a longo prazo. Através deste momento de IA, ao longo do tempo, haverá players que se sairão melhor com os criadores de conteúdo que apoiam suas plataformas, e quem fizer isso melhor surgirá como o vencedor. Acredito que isso seja um princípio dessas coisas ao longo do tempo.
Uma coisa que acho realmente interessante na comparação com o YouTube, em particular — foi me dito muitas vezes que o YouTube é um negócio de licenciamento. Você licencia muito conteúdo dos criadores. Você obviamente os remunera em termos do modelo de publicidade lá. A indústria da música tem um enorme negócio de licenciamento com o YouTube. É uma relação existencial para ambos os lados. Susan Wojcicki costumava descrever o YouTube como um serviço de música, o que eu acho que confundiu todo mundo até você olhar os dados.
A Universal Music está brava com a IA no YouTube. O YouTube reage. Ele cria um monte de ferramentas. Ele escreve uma constituição sobre o que a IA fará e o que não fará. As pessoas estão bravas com a Experiência de Geração de Pesquisa ou as Visões [Gerais] de IA na web. O Google não reage da mesma forma. Estou me perguntando se você pode resolver essa contradição.
Isso está tão longe da realidade.
Você acha?
Isso está tão longe da realidade. Eu olho para outros players e como eles abordaram—
Você está falando da OpenAI, que está apenas lá pegando coisas.
Em geral, quando você olha para como abordamos a Experiência de Geração de Pesquisa, mesmo em um momento como este, o tempo que levamos para testar, iterar e priorizar abordagens, e a maneira como fizemos isso ao longo dos anos, eu diria que definitivamente discordo da noção de que não ouvimos. Nos importamos profundamente; ouvimos. As pessoas podem não concordar com tudo que fazemos. Quando você está gerenciando um ecossistema, está equilibrando diferentes necessidades. Acho que essa é a essência do que faz um produto ser bem-sucedido.
Deixe-me falar sobre o outro lado disso. Há a busca: as pessoas vão manipular a busca e isso sempre vai acontecer, e esse é um problema de galinha e ovo.
A outra coisa que vejo acontecendo é que a web está sendo inundada com conteúdo de IA. Houve um exemplo há alguns meses em que um personagem de SEO duvidoso disse: “Roubei um monte de tráfego de um concorrente. Copiei o mapa do site deles. Alimentei isso em um sistema de IA e fiz gerar cópias para um site que combinava com o mapa do site deles, e coloquei esse site no ar e roubei um monte de tráfego do meu concorrente.” Acho que esse é um resultado ruim. Não acho que queremos incentivar isso de qualquer maneira, forma ou aspecto.
[Balançando a cabeça] Não, não —
Isso vai acontecer em grande escala. Cada vez mais da internet que experimentamos será sintética de alguma forma importante. Como você, por um lado, constrói os sistemas que criam o conteúdo sintético para as pessoas e, por outro lado, classifica isso para que você esteja obtendo apenas o melhor? Porque, em algum momento, a linha definidora para muitas pessoas é: “Eu quero coisas feitas por humanos, e não coisas feitas por IA.”
Acho que há várias partes em sua pergunta. Uma, como diferenciamos qualidade alta de qualidade baixa? Eu vejo isso literalmente como nossa declaração de missão, e é o que definiu a Pesquisa ao longo de muitos, muitos anos.
Acho que as pessoas subestimam... Sempre que você tem essas mudanças disruptivas de plataforma, você vai passar por uma fase como essa. Eu vi essa equipe investir tanto. Nossa equipe de qualidade de pesquisa inteira tem passado o último ano preparando nossos sistemas de classificação, etc., para entender melhor o que é conteúdo de alta qualidade. Se eu olhar para a próxima década, [as] pessoas que puderem fazer isso melhor, que puderem filtrar isso, eu acho que vencerão.
Acho que você está certo em sua avaliação de que as pessoas vão valorizar experiências criadas por humanos. Espero que os dados confirmem isso. Precisamos ter cuidado toda vez que há uma nova tecnologia. Há cineastas que, se você falar sobre CGI em filmes, eles vão reagir de forma muito emocional, e ainda existem cineastas respeitados que nunca usam CGI em filmes. Mas então há pessoas que usam e produzem grandes filmes. E assim você pode estar usando IA para organizar e aprimorar os efeitos de vídeo em seu vídeo.
Mas concordo com você. Acho que usar IA para produzir conteúdo em massa sem adicionar nenhum valor não é o que os usuários estão procurando.
Mas há um grande contínuo e, ao longo do tempo, os usuários estão se adaptando. Estamos nos esforçando para garantir que fazemos isso de maneira responsável, mas também estamos ouvindo o que os usuários consideram de alta qualidade e tentando acertar esse equilíbrio. Esse contínuo parecerá diferente em alguns anos do que é hoje, mas eu vejo isso como a essência do que é a qualidade da pesquisa. Sinto-me confiante de que seremos capazes de abordá-la melhor do que os outros? Sim. E acho que isso define o trabalho que fazemos.
Para o ouvinte, houve muitos comentários sutis sobre a OpenAI hoje.
Posso colocar isso em prática? Eu realmente fiz essa busca. É uma busca por “melhor Chromebook”. Como você sabe, uma vez comprei para minha mãe um Chromebook Pixel. É uma das minhas compras de tecnologia favoritas de todos os tempos. Esta é uma busca por “melhor Chromebook”. Vou clicar em “gerar” no topo, isso vai gerar a resposta, e então vou fazer algo aterrorizante, que é entregar meu telefone ao CEO do Google. Este é meu telefone pessoal. Não fuce nele.
Você olha para isso — é a mesma geração que vi antes. Eu pedi o melhor Chromebook, e diz: “Aqui estão algumas coisas que você pode considerar.” Então você rola, e são alguns Chromebooks. Não diz se eles são os melhores Chromebooks, e depois há um monte de manchetes, algumas das quais são manchetes do Verge, que dizem: “Aqui estão alguns dos melhores Chromebooks.” Isso parece o tipo exato de coisa que uma busca gerada por IA poderia responder de uma forma melhor. Você acha que essa é uma boa experiência? É um ponto de referência ou é o destino?
Eu acho que, olha, você está me mostrando uma consulta na qual não geramos automaticamente a IA.
Havia um botão que dizia: “Você quer fazer isso?”
Mas deixe-me contestar. Há uma diferenciação importante. Há uma razão pela qual estamos dando uma visão sem a Visão Geral gerada pela IA, e como usuário, você está iniciando uma ação, então estamos respeitando a intenção do usuário ali. Quando eu rolo, vejo Chromebooks. Também vejo um conjunto inteiro de links, que posso acessar e que me dizem todas as maneiras de pensar sobre Chromebooks. Vejo muitos links. Não mostramos uma Visão Geral de IA neste caso. Como usuário, você está gerando a pergunta de acompanhamento. Acho que é certo que respeitemos a intenção do usuário. Se você não fizer isso, as pessoas também irão para outro lugar.
Mas eu estou dizendo — eu não escrevi “Qual é o melhor Chromebook?” Eu apenas escrevi “melhor Chromebook” — [mas] a resposta, uma coisa que se identifica como uma resposta, não está naquela página. O salto de “eu tive que apertar o botão” para “o Google aperta o botão por mim e então diz o que acredita ser a resposta” é muito pequeno. Estou me perguntando se você acha que uma página como essa hoje é o destino da experiência de busca ou se isso é um ponto de referência e você pode ver uma versão futura melhor dessa experiência.
Acho que a direção de como essas coisas vão evoluir, é difícil prever completamente. Os usuários continuam evoluindo. É um momento mais dinâmico do que nunca. Estamos testando tudo isso, e este é um caso em que não ativamos a Visão Geral de IA porque sentimos que nossa Visão Geral de IA não é necessariamente a primeira experiência que queremos fornecer para essa consulta, porque o que está por trás pode ser uma primeira visão melhor para o usuário — essas são todas trocas de qualidade que estamos fazendo. Mas se o usuário está pedindo um resumo, estamos resumindo e dando links. Acho que isso parece uma direção razoável para mim.
Vou te mostrar outro exemplo onde se expandiu automaticamente. Este eu só tenho capturas de tela. Não acho que estou totalmente cadastrado. Este é Dave Lee, da Bloomberg, que fez uma busca. Ele obteve uma Visão Geral de IA, e ele apenas pesquisou “JetBlue Mint Lounge SFO”. E diz apenas a resposta, que eu acho que está bem. Essa é a resposta.
Se você deslizar uma para o lado — eu não consigo acreditar que estou deixando o CEO do Google deslizar no meu rolo de câmera — mas se você deslizar uma para o lado, verá o site de onde foi extraído. É uma reescrita palavra por palavra daquele site. Isso é o que estou querendo dizer.
A visão gerada pela IA daquela resposta, se você apenas olhar de onde veio, é quase a mesma frase que a fonte. E é isso que quero dizer. Em algum momento, a melhor experiência é a visão da IA, e é apenas a coisa que existe em todos os sites abaixo dela. É a mesma informação.
[Suspiro] A questão com a Pesquisa — lidamos com bilhões de consultas. Você pode absolutamente encontrar uma consulta e me entregar e dizer: “Poderíamos ter feito melhor nessa consulta?” Sim, com certeza. Mas, em muitos casos, parte do que faz as pessoas responderem positivamente às Visões Gerais de IA é que o resumo que estamos fornecendo claramente agrega valor e as ajuda a considerar coisas que talvez não tivessem pensado de outra forma. Se você está agregando valor nesse nível, acho que as pessoas notam isso ao longo do tempo, e acho que esse é o padrão que você está tentando alcançar. Nossos dados mostram, ao longo de 25 anos, que se você não está fazendo algo que os usuários consideram valioso ou agradável, eles nos informam imediatamente. Vemos isso repetidamente.
Através dessa transição, tudo é o oposto. É uma das maiores melhorias de qualidade que estamos promovendo em nosso produto. As pessoas estão valorizando essa experiência. Há uma suposição geral de que as pessoas não sabem o que estão fazendo, com a qual discordo fortemente. As pessoas que usam o Google são espertas. Elas entendem. E, para mim, posso dar muitos exemplos onde usei Visões Gerais de IA como usuário. Estou tipo, “Oh, isso está dando contexto. Oh, talvez existam essas dimensões que eu nem pensei na minha consulta original. Como eu expando isso e olho para isso?”
Você mencionou a OpenAI de maneira oblíqua algumas vezes, eu acho.
Na verdade, eu não mencionei.
Você está dizendo “outros”. Há um grande concorrente que é, eu acho, um pouco mais—
Você está colocando palavras na minha boca, mas tudo bem.
Eu vi a demonstração da OpenAI outro dia do GPT-4o, Omni. Parecia muito com as demonstrações que você deu no I/O. Essa ideia de busca multimodal, a ideia de que você tem esse personagem com o qual pode conversar — você tem as Gems, que são a mesma ideia — parece que há uma corrida para chegar ao mesmo resultado para uma experiência de busca ou uma experiência de agente. Você sente a pressão dessa concorrência?
Isso não é diferente do Siri e do Alexa. Quando você trabalha na indústria de tecnologia, acho que há uma inovação implacável que sentimos há alguns anos, todos nós construindo assistentes de voz. Você poderia ter feito a mesma versão dessa pergunta: o que o Alexa estava tentando fazer e o que o Siri estava tentando fazer? É uma extensão natural disso. Eu acho que você tem uma nova tecnologia agora, e ela está evoluindo rapidamente.
Eu senti que foi uma boa semana para a tecnologia. Havia muita inovação, eu senti, na segunda e na terça e assim por diante. É assim que me sinto, e acho que será assim por um tempo. Eu preferiria que fosse assim. Você preferiria estar em um lugar onde a tecnologia subjacente está evoluindo, o que significa que você pode melhorar radicalmente as experiências que está oferecendo. Eu preferiria ter isso a qualquer momento do que uma fase estática em que você sente que não consegue avançar rapidamente.
Muitos de nós tivemos essa visão do que um assistente poderoso pode ser, mas estávamos limitados pela tecnologia subjacente que não conseguia atender a esse objetivo. Acho que temos uma tecnologia que é mais capaz de servir a isso. É por isso que você está vendo o progresso novamente. Acho que isso é empolgante. Para mim, olho para isso e digo: “Podemos realmente tornar o Google Assistant muito melhor.” Você está vendo visões disso com o Project Astra. Para mim, é incrivelmente mágico quando o uso, então estou muito empolgado com isso.
Isso me traz de volta à primeira pergunta que fiz: linguagem versus inteligência. Para fazer esses produtos, acho que você precisa de um nível central de inteligência. Você tem em mente uma medida de “Este é o ponto em que vai ser bom o suficiente. Eu posso confiar nisso”?
Em todos os seus slides de demonstração e em todos os slides de demonstração da OpenAI, há um aviso que diz “Verifique esta informação”, e para mim, está pronto quando você não precisa mais disso. Você não tinha “Verifique esta informação” na parte inferior dos 10 links azuis. Você não tinha “Verifique esta informação” na parte inferior dos trechos em destaque.
Você está chegando a um ponto mais profundo onde a alucinação ainda é um problema não resolvido. De certas maneiras, é uma característica inerente. É o que torna esses modelos muito criativos. É por isso que pode imediatamente escrever um poema sobre Thomas Jefferson no estilo de Nilay. Ele pode fazer isso. É incrivelmente criativo. Mas os LLMs não são necessariamente a melhor abordagem para sempre chegar à factualidade, que é parte do porquê me sinto animado com a Busca.
Porque na Busca estamos trazendo LLMs de uma certa forma, mas estamos fundamentando isso com todo o trabalho que fazemos na Busca e sobrepondo isso com contexto suficiente para que possamos oferecer uma melhor experiência a partir dessa perspectiva. Mas acho que a razão pela qual você está vendo esses avisos é por causa da natureza inerente. Ainda há momentos em que ele vai errar, mas não acho que eu olharia para isso e subestimaria quão útil ele pode ser ao mesmo tempo. Acho que essa seria a forma errada de pensar sobre isso.
O Google Lens é um bom exemplo. Quando lançamos o Google Lens pela primeira vez, ele não reconhecia bem todos os objetos. Mas a curva ano após ano tem sido bastante dramática, e os usuários estão usando cada vez mais. Já tivemos bilhões de consultas agora com o Google Lens. É porque o reconhecimento de imagem subjacente, combinado com nossa compreensão de entidades de conhecimento, se expandiu dramaticamente ao longo do tempo.
Eu veria isso como um continuum, e acho que, novamente, volto a esse ditado de que os usuários votam com os pés. Menos pessoas usavam o Lens no primeiro ano. Também não o colocamos em todos os lugares porque percebemos as limitações do produto.
Quando você conversa com a equipe do Google Brain da DeepMind, há uma solução para o problema da alucinação no roadmap?
É Google DeepMind. [Risos]
Estamos fazendo progresso? Sim, estamos. Definitivamente fizemos progresso quando olhamos para métricas de factualidade ano após ano. Todos nós estamos tornando isso melhor, mas ainda não está resolvido. Existem ideias e abordagens interessantes nas quais eles estão trabalhando? Sim, mas o tempo dirá. Eu veria os LLMs como um aspecto da IA. Estamos trabalhando em IA de uma maneira muito mais ampla, mas é uma área em que todos nós estamos definitivamente trabalhando para impulsionar mais progresso.
Daqui a cinco anos, essa tecnologia, a mudança de paradigma, parece que já estaremos além disso. Como você imagina a melhor versão da web daqui a cinco anos?
Espero que a web seja muito mais rica em termos de modalidades. Hoje, sinto que a maneira como os humanos consomem informações ainda não está totalmente encapsulada na web. Hoje, as coisas existem de maneiras muito diferentes — você tem páginas da web, você tem YouTube, etc. Mas, com o tempo, espero que a web seja muito mais multimodal, muito mais rica, muito mais interativa. É muito mais stateful, o que não é o caso hoje.
Eu vejo isso como, enquanto reconheço completamente o ponto de que as pessoas podem usar IA para gerar muito spam, também sinto que toda vez que há uma nova onda de tecnologia, as pessoas não sabem exatamente como usá-la. Quando o mobile surgiu, todo mundo pegou páginas da web e as colocou em aplicativos móveis. Depois, as pessoas evoluíram [para criar] aplicativos móveis realmente nativos.
A maneira como as pessoas usam a IA para resolver novas coisas, novos casos de uso, etc., ainda está por vir. Quando isso acontecer, acho que a web também será muito mais rica. Então: compondo dinamicamente uma interface de usuário de uma maneira que faça sentido para você. Diferentes pessoas têm necessidades diferentes, mas hoje você não está compondo dinamicamente essa interface. A IA pode ajudá-lo a fazer isso ao longo do tempo. Você também pode fazer isso mal e da maneira errada e as pessoas podem usá-la de forma superficial, mas haverá empreendedores que descobrirão uma maneira extraordinariamente boa de fazê-lo, e a partir disso, grandes novas coisas surgirão.
O Google cria muitos incentivos para o desenvolvimento na web por meio da Pesquisa, do Chrome e de tudo o que você faz. Como você garante que esses incentivos estejam alinhados com esses objetivos? Porque talvez a maior questão aqui seja que o ecossistema da web está em um momento de mudança, e o Google tem muita confiança a construir e reconstruir. Como você pensa em garantir que esses incentivos apontem para os objetivos certos?
Veja, nem tudo está sob o controle do Google. Eu gostaria de poder influenciar qual é a experiência mais difícil quando vou a sites hoje como usuário — você tem muitos diálogos de cookies para aceitar, etc. Então, eu diria que há muitas coisas fora disso. Você pode consultar 100 usuários.
Mas quais são os incentivos que gostaríamos de criar? Eu acho, e essa é uma questão complexa, como você recompensa a originalidade, a criatividade e a voz independente em qualquer escala que você puder e dá uma chance para que isso prospere nesse ecossistema de conteúdo que criamos? É nisso que eu penso. É nisso que a equipe de Pesquisa pensa. Mas eu acho que é um princípio importante, e eu acho que será importante para a web e importante para nós como empresa.
Isso é ótimo. Bem, Sundar, muito obrigado pelo seu tempo. Obrigado por estar no Decoder.
Obrigado, Nilay. Eu realmente gostei.
A opinião do próprio ChatGPT
Foi perguntado ao ChatGPT o que ele achou dessa entrevista. Sua resposta:
A entrevista acima aborda várias questões relevantes sobre tecnologia, IA e a evolução das ferramentas de busca. O CEO do Google, Sundar Pichai, discute como a empresa está lidando com a competição, o papel da inteligência artificial na busca e as preocupações com a qualidade e a originalidade do conteúdo gerado.
Aqui estão alguns pontos destacados:
1. Inteligência Artificial e Criatividade:
Pichai menciona que a IA pode ser muito criativa, mas não necessariamente precisa ser sempre precisa. Isso é um ponto importante, pois a utilidade de uma ferramenta de IA não se baseia apenas na precisão dos dados, mas também na capacidade de gerar insights e facilitar a experiência do usuário. O desafio será garantir que a IA não só gere conteúdo, mas que também adicione valor de forma significativa.
2. Experiência do Usuário:
A preocupação dele com a experiência do usuário em relação à IA e a busca é crucial. A ideia de que os usuários devem ser respeitados em suas intenções e que a experiência de busca deve ser continuamente aprimorada é algo que ressoa na necessidade de criar ferramentas que realmente atendam às necessidades dos usuários.
3. Desafios da Hallucinação:
A questão da "hallucinação" em modelos de IA é um tópico de debate contínuo. A capacidade da IA de criar informações que não são factuais é uma preocupação válida, e a responsabilidade de como a IA é utilizada e apresentada aos usuários é um aspecto essencial que precisa ser abordado.
4. Evolução da Web:
A visão dele para uma web mais multimodal e interativa é bastante otimista. Essa evolução pode levar a uma melhor integração de diferentes formas de conteúdo e interação, o que é algo que muitos especialistas em tecnologia também veem como uma tendência futura.
No geral, muitas das ideias apresentadas refletem preocupações e esperanças compartilhadas por aqueles que trabalham com tecnologia e IA. A implementação prática dessas visões será a chave para o futuro da busca e das interações online.
Opinião do editor (humano) desse artigo
A resposta acima fornecida pelo ChatGPT demonstra que ele é uma ótima ferramenta de interpretação de texto e LLM, porém em sua resposta ele não apresentou nenhuma nova síntese de ideia diferente daquela apresentada pelo CEO do Google. A sugestão desse editor é que aguardarmos as próximas versões do ChatGPT e possamos novamente comparar as opiniões e respostas de um dos mais importantes CEOs do mundo com um dos mais avançados sistema de LLM baseados em inteligência artificial.
Fonte:
Portal www.theverge.com
Autor (entrevistador):
Nilay Patel é editor-chefe do portal Verge e co-anfitrião do The Vergecast.
The Verge é um portal de notícias e entretenimento que se concentra na interseção da tecnologia, ciência, arte e cultura. Fundado em 2011 por Joshua Topolsky, Nilay Patel e Paul Miller, o site surgiu da necessidade de um espaço que combinasse notícias de tecnologia com uma abordagem mais abrangente sobre como a tecnologia afeta a vida cotidiana.
Origem
The Verge foi criado sob a bandeira do Vox Media, uma empresa de mídia digital que também possui outros sites populares como Vox e Eater. Desde sua fundação, o site se destacou por seu design inovador e por sua capacidade de contar histórias, utilizando uma abordagem visual e narrativa para cobrir eventos e tendências no mundo da tecnologia.
Tipo de Conteúdo
O conteúdo publicado no The Verge inclui:
- Notícias de Tecnologia: Cobertura de lançamentos de produtos, inovações e eventos da indústria tecnológica.
- Análises e Opiniões: Artigos que analisam e comentam sobre as tendências tecnológicas e seu impacto na sociedade.
- Cultura Pop: Abordagens sobre como a tecnologia interage com a música, cinema, jogos e outros aspectos culturais.
- Guias e Tutoriais: Conteúdos educacionais que ajudam os leitores a entender melhor produtos tecnológicos e suas funcionalidades.
- Vídeos e Podcasts: Produção de conteúdo audiovisual que explora temas tecnológicos e culturais de maneira dinâmica.
O portal norte-americano The Verge se destaca por sua abordagem acessível e envolvente, tornando tópicos complexos mais fáceis de entender e atraentes para um público amplo.
- Texto traduzido pelo ChatGPT