Published -
January 28, 2025
Em 2019, eu e alguns dos meus colegas da ByteDance construímos um enorme motor criativo para agências e marcas chinesas, o Mega Creative (cc.oceanengine.com). O ano também ficou marcado como um ponto de virada no espaço publicitário, com milhares de agências se esforçando para usá-lo para criar grandes quantidades de vídeo. A publicidade em vídeo passou oficialmente da criação individual para a geração em lote. Chamamos isso de ano da publicidade programática.
Mas a maior desvantagem da publicidade programática é o conteúdo duplicado. Como temos um número limitado de fontes de conteúdo (conteúdo original) disponíveis, mas é necessário um número infinito de vídeos para veiculação. Então, até que haja tecnologia geradora de IA, todos os usuários de anúncios programáticos enfrentarão um enorme risco de duplicação de conteúdo.
Isso também significa que dos 100.000 vídeos que geramos, apenas 1% pode trazer 99% de retorno.
Isso significa que precisamos produzir apenas 1% dos vídeos? A resposta é não. Porque 99% dos vídeos trazem dados de teste protegidos contra a máquina do algoritmo de recomendação, e sem 99% dessa parte dos vídeos, não há 1% de chance de ganhar.
Isso continua até 2021.
Surgiu uma nova forma de atuar na indústria de publicidade programática, chamada estratégia de lentes vazias na China, e mais pessoas a chamam de vídeo B-Roll no mercado global. Na verdade, o princípio é muito simples de explicar, embora o número de fontes de vídeo seja fixo, mas alguma semelhança da tela é capaz de desempenhar um papel complementar para fazer com que o vídeo pareça diferente. Por exemplo, um vídeo de anúncio de jogo pode usar alguns vídeos engraçados ou históricos para encobrir determinados videoclipes, a fim de atingir o requisito de reduzir a taxa de repetição de vídeo.
Parece bom, certo? Mas isso ainda não resolve o problema da repetição na publicidade programática. Sem resolver o problema da repetição, as empresas não conseguirão adquirir a capacidade de continuar crescendo em grande escala.
Quando vimos o GPT3 dentro do ByteDance, ainda estávamos hesitantes em nossa mente. Como não há apenas uma cópia no vídeo, a porcentagem mais alta ainda é de muitas imagens de vídeo. Se os quadros de vídeo puderem ser gerados massivamente pela IA com base em palavras-chave, mesmo que a taxa de usabilidade seja inferior a 50%, ainda é uma direção na qual todos podem apostar. Porque sabemos que a criação de vídeos representa pelo menos 25% das dezenas de bilhões de dólares gastos em publicidade a cada ano. Um produto que deseja alcançar uma compra em massa estável deve ter mais de 1.000 vídeos no back-end do anúncio todos os dias. Alguns dos principais setores consumidores de vídeo, como jogos e comércio eletrônico, estão consumindo mais de 10.000 vídeos por dia.
Quando hesitamos, a oportunidade sempre bate à porta com antecedência. Recebemos uma solicitação de um cliente que ficou mais do que feliz em priorizar o uso da tecnologia de IA para roteiristas de vídeo, porque por trás do apoio de 500 redatores de vídeo por dia está o resultado de uma equipe de mais de 10 criativos, que mal conseguem sustentar o resultado após um debate constante das 8h às 23h todos os dias.
O feedback da tecnologia de inteligência artificial de redação superou as expectativas, e ideias ainda mais impressionantes surgiram enquanto eles a usavam. “Isso é muito divertido!” Os clientes nos dão feedback frequente, e o fornecimento de serviços de tecnologia de IA não aumentou exponencialmente o número de gerentes de sucesso do cliente que tivemos, embora tenhamos nos preparado para isso com bastante antecedência. Mas o serviço altamente personalizado da tecnologia de IA fez com que esses preparativos parecessem completamente desnecessários.
Então, saímos imediatamente da ByteDance e começamos a criar um novo produto de publicidade programática.
Inicialmente, também queríamos começar a usar a tecnologia de redação de IA, mas percebemos que já havia produtos de redação estabelecidos, como jasper.ai e copy.ai já atendendo nossos clientes. Então, depois de pensar nisso por um longo tempo, decidimos começar com a produção de conteúdo de vídeo, onde temos mais experiência.
Além disso, na verdade, existe outro dilema, o problema 1 e o problema 2, que devem ser o problema de maior prioridade a ser resolvido. Na verdade, em 2023, não temos uma imagem clara de quão realista o conteúdo de IA generativo, especialmente no campo da geração de vídeo, pode realmente ser. Por exemplo, embora a OpenAI tenha lançado um vídeo de demonstração do SORA, as frequentes fotos de penetração e os problemas antifísicos na imagem ainda nos decepcionam um pouco. Afinal, precisamos fornecer serviços de vídeo de alta qualidade para serviços comerciais, não produzir toneladas de lixo eletrônico.
Assim, nossas escolhas ficaram claras: começamos globalizando o vídeo e rapidamente obtivemos o apoio de clientes iniciantes na China continental, Hong Kong e Cingapura. Os negócios desses clientes são globalizados, especialmente no Sudeste Asiático e no Leste Asiático, onde a diferença linguística entre os diferentes países é muito grande. Uma das maiores dores de cabeça é a inconsistência na extensão dos idiomas em diferentes países, por exemplo:
em inglês: Este é um vestido bonito;
Em japonês:
Em indonésio: Ini adalah gaun yang terlihat bagus
Em árabe: 192
Podemos ver que, mesmo parcialmente pronunciado, o comprimento varia muito. Por esse motivo, treinamos especificamente o modelo de linguagem para ajuste fino no nível da tradução, usando um grande número de otimização direcionada do corpus de anúncios.
Uma vez que tivemos o modelo de tradução de vídeo No local, recebemos mais feedback de nossos clientes sobre as faces localizadas. Com base nos dados acumulados por nossos clientes de longo prazo em material de vídeo publicitário, atores localizados afetarão a taxa de conversão de cerca de 5 pp-8 pp do que atores não localizados. Se o valor da colocação for grande o suficiente, essa taxa de conversão de 5pp-8pp provavelmente estará na escala de dezenas ou centenas de milhares de dólares em receita.
Então, começamos a tentar resolver rapidamente o problema das faces localizadas. Existem duas estratégias para resolver o problema de faces localizadas: geração de avatar ou troca de faces de vídeo. A vantagem da geração de avatares é o efeito realista, mas a desvantagem também é óbvia: avatares novos são muito caros. Estimamos que um videoclipe gerado a partir de um avatar totalmente novo é 8 a 10 vezes mais caro do que um modelo de troca facial de vídeo, porque primeiro precisamos treinar uma imagem totalmente nova do modelo de avatar. No entanto, o modelo de troca facial de vídeo também tem a desvantagem óbvia de uma maior taxa de falha na substituição em algumas imagens laterais ou faciais incompletas.
Mas o custo de usar esse modelo é baixo e, embora a taxa de sucesso seja baixa, os clientes estão dispostos a aceitar vários usos e escolher os segmentos que funcionam melhor. (É claro que estamos melhorando continuamente o modelo de troca facial para obter os melhores resultados)
Não esqueçamos que nossa gênese original foi permitir que nossos clientes utilizassem a tecnologia AIGC para a produção de vídeos publicitários programáticos em grande escala, e ainda estamos no caminho certo para chegar lá.
Construímos o editor de vídeo AIGC que pertence ao espaço publicitário programático baseado no conceito ComfYui. Os clientes podem conectar o processo de produção usando vários tipos de cartões AIGC fornecidos por nós, que são modelados a partir do poderoso OpenAI ou Anthropic, e também dos famosos fornecedores de modelagem de vídeo generativa kling, luma, minimax, pikalabs, haiper e assim por diante. Concluímos o fim da maioria das APIs para que os clientes não precisem passar por várias plataformas para usá-las, eles possam usá-las diretamente no fluxo de trabalho do ClipZap. E também oferecemos o programa de pontos mais favorável, que economiza mais tempo e mão de obra do que ligar diretamente para essas APIs.
Antes do lançamento do ClipZap 1.0, temos clientes na China, Cingapura, Canadá, Estados Unidos e outras regiões, e gradualmente compartilharemos nossas histórias com nossos clientes posteriormente. Estamos migrando rapidamente mais recursos do produto para o editor de fluxo de trabalho ClipZap para torná-lo ainda mais poderoso. Atualmente, para coletar mais feedback, nosso editor é totalmente gratuito, você pode experimentar qualquer recurso do editor sem quaisquer limitações.
Como sugerimos acima, foi um de nossos clientes comerciais de longa data que pressionou o botão Iniciar. Seu principal negócio é a produção de episódios, incluindo séries de TV, mas eles também têm uma grande quantidade de negócios envolvidos em curtas simplificados, vídeos curtos e assim por diante. Em um dia normal, sua equipe de roteiristas e diretores (um grupo de cerca de 10 pessoas, cada uma dedicada à criação de um episódio curto) produz mais de 500 referências de textos e roteiros de vídeo por dia para o diretor do grupo ou grupo extraírem para análise. Como você sabe, esses tipos de episódios precisam ser criados com um impulso constante para o sucesso contínuo.
Mas a capacidade de atenção humana e o poder criativo são ativos finitos. Portanto, por trás da produção diária obrigatória de conteúdo, há, na verdade, muita ação de plágio, levantamento e reescrita leve acontecendo em apoio, e esse conteúdo obviamente não é aprovado pelos roteiristas e diretores.
Então, o surgimento do GPT trouxe uma reviravolta.
Mas o que queremos falar não é sobre como atender bem a indústria de formatos curtos, que é, obviamente, uma de nossas fontes de clientes, haha. Queremos falar sobre uma grande mudança no modelo de produção de conteúdo, desde a criação de conteúdo em uma única boutique até a criação em escala personalizada.
Essa mudança se aplica ao setor de publicidade, ao setor de formatos curtos, ao setor de comércio eletrônico e ao setor de serviços de marketing de SEO. Uma produção de conteúdo mais personalizada, profissional e em grande escala pode ajudar os clientes a obter recursos de usuário de maior qualidade. O surgimento do AIGC melhorou muito a legibilidade e a personalização do conteúdo, não precisamos mais unir massivamente o conteúdo ou contratar mais redatores para escrever postagens no blog, precisamos apenas treinar um robô de IA que atenda às necessidades da geração para concluir 80% do trabalho de conteúdo.
Antes de tudo, gostaríamos de listar alguns exemplos de produtos similares para ajudar você a entender as principais competências do clipzap.
Filosofia central do produto: A filosofia de produto sem código da Zapier é uma aplicação simples para automação
Os principais recursos incluem:
Vantagens competitivas
Participação de mercado
Filosofia central do produto
A principal estratégia de produto da Palantir é uma solução de fusão e análise de dados altamente personalizada, adaptada para casos de uso complexos.
Os principais produtos incluem:
Vantagens competitivas
Isso não parece surpreendente? A alta participação de mercado dos produtos de software de automação representa um forte potencial de lucro. A tecnologia subjacente por trás desses softwares de automação é o fluxo de trabalho, conhecido como agregador modular de microsserviços de API.
Diferenciamos isso ao usar a produção de conteúdo de vídeo como ponto de entrada, pois a demanda por produção de conteúdo de vídeo está aumentando e podemos ver mais clientes nesse espaço que estão tendo dificuldades com a produção de vídeo. (Obrigado tiktok, obrigado Instagram, obrigado x, foram vocês que fizeram do vídeo o novo meio de comunicação.)
Se você me perguntar qual é o maior tesouro de um pirata, acredito que seria o Pérola Negra. As gemas e moedas de ouro à sua frente podem encher brevemente sua carteira, mas somente a Pérola Negra pode levá-lo a tesouros mais infinitos.
ClipZap é sua pérola negra. Em condições ideais, você pode equipar seu Black Pearl com quantas peças de artilharia pesada quiser, como o poderoso AI Video Generator, AI Auto Mixer. Ou escolha o melhor timoneiro e primeiro oficial, como o AI Video Effects Generator ou o AI Copy Generator. Depois de fazer isso, você pode navegar com o Black Pearl para lugares distantes, como sua página de destino personalizada, sua plataforma de comércio eletrônico ou uma plataforma de publicidade cheia de oportunidades e desafios.
Como escolher essas colocações é muito importante para você. Além de oferecer a cada usuário possibilidades ilimitadas de combinações e colocações, também fornecemos aos usuários um sistema de proteção de dados e conteúdo altamente seguro. Cada etapa dos dados e do conteúdo gerados no fluxo de trabalho é rastreável e oferecerá suporte ao histórico de visualização no futuro. Ao mesmo tempo, usamos as barreiras antiataque mais seguras do mundo e os fornecedores de serviços em nuvem mais confiáveis.
Quando você tem esses superpoderes, temos certeza de que o Pérola Negra o levará a lugares cheios de tesouros.