Tornando os Shorts do YouTube mais pesquisáveis
Vídeos pequenos Os Shorts do YouTube – vídeos curtos com menos de um minuto de duração – são vistos mais de 50 bilhões de vezes por dia e estão crescendo.
Os Shorts são criados em apenas alguns minutos e muitas vezes não incluem descrições e títulos úteis, o que os torna mais difíceis de serem encontrados na pesquisa. Por isso, apresentamos nosso modelo de linguagem visual Flamingo para ajudar a gerar descrições.
Ao analisar os frames iniciais do vídeo, o modelo explica o que está sendo mostrado na tela – por exemplo, “um cachorro equilibrando uma pilha de biscoitos na cabeça”. Este texto é armazenado como metadados no YouTube para categorizar melhor os vídeos e combinar os resultados da pesquisa com as consultas dos espectadores.
De estrelas emergentes do K-pop a guias gastronômicos locais, o YouTube está lançando essa tecnologia em Shorts, e descrições de vídeos geradas automaticamente já estão sendo aplicadas a todos os novos envios. Agora, os espectadores podem assistir a vídeos mais relevantes e encontrar mais facilmente o que procuram em uma gama mais diversificada de criadores globais.
Nossa abordagem
Aplicando nossa pesquisa de IA para aprimorar a experiência no YouTube
Ajudando a enriquecer a vida das pessoas com a nossa investigação, estabelecemos parcerias com empresas da Alphabet para aplicar a nossa tecnologia no sentido de melhorar os produtos e serviços utilizados por milhares de milhões de pessoas todos os dias.
Um dos nossos principais parceiros é o YouTube, que tem a missão de dar voz a todos e mostrar-lhes o mundo.
Trabalhando em conjunto com as equipes de produto e engenharia do YouTube, ajudamos a otimizar os processos de tomada de decisão que aumentam a segurança, diminuem a latência e melhoram a experiência do espectador, criador e anunciante para todos.
Otimizando a compactação de vídeo
Com o aumento do vídeo durante a pandemia da COVID-19 e a quantidade total de tráfego da Internet que deverá crescer no futuro, a compressão de vídeo é um problema cada vez mais importante.
Trabalhando em conjunto com o YouTube, exploramos o potencial do nosso modelo de IA, MuZero , para melhorar o codec VP9, um formato de codificação que ajuda a compactar e transmitir vídeo pela Internet. Em seguida, aplicamos o MuZero a parte do tráfego ao vivo do YouTube.
Desde o início da produção de uma parte do tráfego ao vivo do YouTube, demonstramos uma redução média de 4% na taxa de bits em um conjunto grande e diversificado de vídeos. A taxa de bits ajuda a determinar a capacidade de computação e a largura de banda necessária para reproduzir e armazenar vídeos – impactando tudo, desde o tempo que um vídeo leva para carregar até sua resolução, buffer e uso de dados.
Ao melhorar o codec VP9 no YouTube, ajudamos a reduzir o tráfego da Internet, o uso de dados e o tempo necessário para carregar vídeos. E através da otimização da compressão de vídeo, milhões de pessoas em todo o mundo podem assistir a mais vídeos usando menos dados.
Protegendo a segurança da marca para criadores e anunciantes
Desde 2018, colaboramos com o YouTube para educar melhor os criadores sobre quais tipos de vídeos podem gerar receita com anúncios e garantir que os anúncios sejam exibidos junto com o conteúdo que segue as diretrizes de conteúdo adequado para publicidade do YouTube.
Juntamente com a equipe do YouTube, desenvolvemos um modelo de qualidade de rótulo (LQM) que ajuda a rotular vídeos com maior precisão, de acordo com as diretrizes de compatibilidade de publicidade do YouTube. O modelo melhorou a precisão dos anúncios veiculados em vídeos, de acordo com as políticas de compatibilidade de anúncios do YouTube.
Ao melhorar a forma como os vídeos são identificados e classificados, aumentamos a confiança na plataforma para espectadores, criadores e anunciantes.
Melhorando os capítulos automáticos
Nos últimos anos, os criadores começaram a adicionar capítulos aos seus vídeos para facilitar ao público encontrar o conteúdo que procuravam, mas este processo manual pode ser lento e trabalhoso.
Para melhorar a experiência do criador e do espectador, colaboramos com a equipe de pesquisa do YouTube e desenvolvemos um sistema de IA que pode processar automaticamente transcrições de vídeo, recursos de áudio e visuais e sugerir segmentos de capítulos e títulos para criadores do YouTube.
Conforme Sundar Pichai apresentou no Google I/O 2022 , os capítulos gerados automaticamente já estão disponíveis para 8 milhões de vídeos hoje, e planejamos dimensionar esse recurso para mais de 80 milhões de vídeos no próximo ano.
Usando AutoChapters, os espectadores gastam menos tempo procurando conteúdo específico e os criadores economizam tempo criando capítulos para seus vídeos.
Tecnologias e produtos em evolução
À medida que a sociedade e a tecnologia que utilizamos evoluem, procuramos continuamente novas formas de ajudar a melhorar as tecnologias e produtos quotidianos da Alphabet com a nossa investigação em IA.
Nosso trabalho com o YouTube já causou um grande impacto e esperamos fazer muitas melhorias significativas na vida das pessoas por meio de nossas colaborações contínuas.