Published -
January 26, 2025
En 2019, algunos de mis colegas de ByteDance y yo creamos un enorme motor creativo para agencias y marcas chinas, Mega Creative (cc.oceanengine.com). El año también se convirtió en un punto de inflexión en el ámbito de la publicidad, ya que miles de agencias se apresuraron a utilizarlo para crear grandes cantidades de vídeo. La publicidad en vídeo pasó oficialmente de la creación individual a la generación por lotes. Lo llamamos el año de la publicidad programática.
Pero la mayor desventaja de la publicidad programática es el contenido duplicado. Dado que tenemos un número limitado de fuentes de contenido (contenido original) disponibles, necesitamos una cantidad infinita de vídeos para su colocación. Así que hasta que no haya tecnología que genere inteligencia artificial, todos los usuarios de anuncios programáticos se enfrentarán a un enorme riesgo de duplicación de contenido.
Esto también significa que de los 100 000 vídeos que generamos, solo el 1% puede generar una rentabilidad del 99%.
¿Significa eso que solo necesitamos producir ese 1% de los vídeos? La respuesta es no. Porque el 99% de los vídeos muestran datos de prueba comparados con los de la máquina de algoritmos de recomendación, y sin el 99% de esta parte de los vídeos, no hay un 1% de posibilidades de ganar.
Esto continuará hasta 2021.
Apareció una nueva forma de jugar en la industria de la publicidad programática, que en China se llama estrategia de lentes vacías, y más personas lo llaman video B-Roll en el mercado global. De hecho, el principio es muy sencillo de explicar, aunque el número de fuentes de vídeo es fijo, pero la similitud de la pantalla puede desempeñar un papel complementario para hacer que el vídeo parezca diferente. Por ejemplo, un vídeo publicitario de un juego puede utilizar algunos vídeos divertidos o secuencias de vídeo históricas para encubrir ciertos clips de vídeo con el fin de cumplir con el requisito de reducir la tasa de repetición de vídeos.
Se ve bien, ¿verdad? Pero todavía no resuelve el problema de la repetición en la publicidad programática. Sin resolver el problema de la repetición, las empresas no podrán adquirir la capacidad de seguir creciendo a gran escala.
Cuando vimos GPT3 en ByteDance, todavía teníamos dudas. Porque no solo hay texto en el vídeo, sino que el porcentaje más alto sigue siendo una gran cantidad de imágenes de vídeo. Si la IA puede generar los fotogramas de vídeo de forma masiva basándose en palabras clave, aunque la tasa de usabilidad sea inferior al 50%, es una dirección por la que todos pueden apostar. Porque sabemos que la creación de vídeos representa al menos el 25% de las decenas de miles de millones de dólares que se gastan en publicidad cada año. Un producto que quiera lograr una compra masiva estable debe tener más de 1000 vídeos en el backend de anuncios todos los días. Algunos sectores clave que consumen vídeos, como los videojuegos y el comercio electrónico, consumen más de 10 000 vídeos al día.
Cuando dudamos, la oportunidad siempre llama a la puerta con antelación. Recibimos una solicitud de un cliente que estaba más que encantado de priorizar el uso de la tecnología de inteligencia artificial para los guionistas de vídeo, porque detrás del apoyo de 500 redactores de vídeo al día hay el resultado de un equipo de más de 10 creativos, que apenas pueden mantener el resultado tras una lluvia de ideas constante todos los días entre las 8:00 de la mañana y las 23:00 de la noche.
Los comentarios de la tecnología de inteligencia artificial de redacción superaron las expectativas, y surgieron ideas aún más asombrosas mientras la usaban. «¡Esto es muy divertido!» Los clientes nos envían comentarios con frecuencia, y la prestación de servicios de tecnología de inteligencia artificial no ha aumentado de forma exponencial el número de gestores de éxito de clientes que tenemos, a pesar de que nos hemos preparado para ello con bastante antelación. Sin embargo, el servicio altamente personalizado de la tecnología de inteligencia artificial hizo que esos preparativos parecieran completamente innecesarios.
Así que inmediatamente dejamos ByteDance y empezamos a crear un nuevo producto de publicidad programática.
Al principio, también queríamos abrirnos paso en la tecnología de redacción de textos publicitarios con inteligencia artificial, pero nos dimos cuenta de que ya existían productos de redacción publicitaria establecidos, como jasper.ai y copy.ai ya estamos sirviendo a nuestros clientes. Entonces, después de pensarlo durante mucho tiempo, decidimos comenzar con la producción de contenido de video, donde tenemos más experiencia.
Además de esto, en realidad hay otro dilema, el problema 1 y el problema 2, que deberían ser el problema de mayor prioridad a resolver. De hecho, en 2023 no tenemos una idea clara de qué tan realista puede ser el contenido generativo de IA, especialmente en el campo de la generación de vídeos. Por ejemplo, aunque OpenAI publicó un vídeo de demostración de SORA, las frecuentes tomas de penetración y los problemas antifísicos de la imagen aún nos decepcionan un poco. Después de todo, necesitamos ofrecer servicios de vídeo de alta calidad para los servicios comerciales, no producir toneladas de contenido basura.
Así que nuestras opciones quedaron claras: empezamos por globalizar el vídeo y rápidamente obtuvimos el apoyo de los clientes de China continental, Hong Kong y Singapur que empezaban a trabajar en frío. Los negocios de estos clientes están globalizados, especialmente en el sudeste asiático y el este asiático, donde la brecha lingüística entre los diferentes países es muy grande. Uno de los mayores quebraderos de cabeza es la incoherencia en la longitud de los idiomas en los diferentes países, por ejemplo:
en inglés: Este es un vestido bonito;
En japonés:
En indonesio: Ini adalah gaun yang terlihat bagus
En árabe:
Podemos ver que, aunque sea parcialmente pronunciada, la longitud varía mucho. Por este motivo, hemos entrenado específicamente el modelo lingüístico para ajustarlo a nivel de traducción, utilizando una gran cantidad de corpus publicitarios para la optimización específica.
Una vez que tuvimos el modelo de traducción de vídeo en su lugar, recibimos más comentarios de nuestros clientes sobre las caras localizadas. Basándonos en los datos acumulados por nuestros clientes de larga data sobre el material de vídeo publicitario, los actores localizados afectarán a la tasa de conversión entre 5 y 8 puntos porcentuales más que los actores no localizados. Si el importe de la colocación es lo suficientemente grande, lo más probable es que esta tasa de conversión de 5 a 8 puntos porcentuales se sitúe en la escala de decenas o cientos de miles de dólares en ingresos.
Así que empezamos rápidamente a tratar de resolver el problema de las caras localizadas. Hay dos estrategias para resolver el problema de los rostros localizados: la generación de avatares o el intercambio de rostros en vídeo. La ventaja de la generación de avatares es el efecto realista, pero la desventaja también es obvia: los avatares nuevos son muy caros. Hemos estimado que un videoclip generado a partir de un avatar nuevo es entre 8 y 10 veces más caro que un modelo de intercambio de caras en vídeo, ya que primero tenemos que preparar una imagen completamente nueva del modelo de avatar. Sin embargo, el modelo de intercambio de caras en vídeo también tiene la desventaja muy obvia de una mayor tasa de fallas de reemplazo en algunas imágenes incompletas laterales o faciales.
Sin embargo, el costo de usar este modelo es bajo y, aunque la tasa de éxito es baja, los clientes están dispuestos a aceptar múltiples usos y elegir los segmentos que mejor funcionen. (Por supuesto, estamos mejorando continuamente el modelo de intercambio facial para lograr los mejores resultados)
No olvidemos que nuestra génesis original fue cómo permitir a nuestros clientes utilizar la tecnología AIGC para la producción de vídeos publicitarios programáticos a gran escala, y todavía estamos en camino de lograrlo.
Creamos el editor de vídeo AIGC que pertenece al espacio de publicidad programática basado en el concepto ComfyUI. Los clientes pueden conectar el proceso de producción utilizando varios tipos de tarjetas AIGC que proporcionamos, que están modeladas a partir de los potentes OpenAI o Anthropic, y también de los famosos proveedores de modelado de vídeo generativo kling, luma, minimax, pikalabs, haiper, etc. Hemos terminado de eliminar la mayoría de las API para que los clientes no tengan que ir a varias plataformas para usarlas, sino que puedan usarlas directamente en el flujo de trabajo de ClipZap. Además, ofrecemos el programa de puntos más favorable, que ahorra más tiempo y mano de obra que llamar directamente a estas API.
Antes del lanzamiento de ClipZap 1.0, teníamos clientes en China, Singapur, Canadá, Estados Unidos y otras regiones, y compartiremos gradualmente nuestras historias con nuestros clientes más adelante. Estamos trasladando rápidamente más funciones del producto al editor de flujo de trabajo ClipZap para que este editor sea aún más potente. Actualmente, para recopilar más comentarios, nuestro editor es de uso completamente gratuito, puedes usar cualquier función del editor sin ningún tipo de limitación.
Como hemos sugerido anteriormente, fue uno de nuestros clientes comerciales desde hace mucho tiempo quien presionó el botón de inicio. Su actividad principal es la producción de episodios, incluidas las series de televisión, pero también tienen una gran cantidad de negocios relacionados con cortometrajes simplificados, vídeos cortos, etc. En un día normal, su equipo de guionistas y directores (un grupo de unas 10 personas, cada una dedicada a la creación de un episodio corto) produce más de 500 copias de vídeo y referencias de guiones al día para que el director del grupo o del grupo de rodaje las extraiga para su revisión. Como ya sabéis, este tipo de episodios tienen que crearse con un esfuerzo constante para conseguir un éxito continuo.
Sin embargo, la capacidad de atención humana y el poder creativo son activos finitos. Por lo tanto, detrás de la producción diaria obligatoria de contenido hay en realidad una gran cantidad de plagio, levantamientos y ligeras acciones de reescritura en apoyo, y ese contenido obviamente no es del todo aprobado por los guionistas y directores.
Así que la aparición de GPT les supuso un cambio radical.
Pero de lo que queremos hablar no es de cómo atender bien a la industria de los formatos cortos, que es, por supuesto, una de nuestras fuentes de clientes, ja, ja. De lo que queremos hablar es de un cambio masivo en el modelo de producción de contenido, pasando de la creación de contenido para una sola tienda a la creación personalizada a escala.
Este cambio se aplica a la industria de la publicidad, la industria de los formatos cortos, la industria del comercio electrónico y la industria de los servicios de marketing SEO. Una producción de contenido más personalizada, profesional y a gran escala puede ayudar a los clientes a obtener recursos de usuario de mayor calidad. La aparición del AIGC ha mejorado considerablemente la legibilidad y la personalización del contenido. Ya no necesitamos unir contenido de forma masiva ni contratar a más escritores para que escriban entradas en blogs, solo necesitamos entrenar a un robot de inteligencia artificial que satisfaga las necesidades de la generación para completar el 80% del trabajo de contenido.
En primer lugar, nos gustaría enumerar algunos ejemplos de productos similares para ayudarlo a comprender las competencias principales de clipzap.
Filosofía principal del producto: La filosofía de producto sin código de Zapier es una aplicación sencilla para la automatización
Entre las principales características se incluyen:
Ventajas competitivas
Cuota de mercado
Filosofía básica del producto
La estrategia de producto principal de Palantir es una solución de análisis y fusión de datos altamente personalizada que se adapta a casos de uso complejos.
Los principales productos incluyen:
Ventajas competitivas
¿No suena sorprendente? La elevada cuota de mercado de los productos de software de automatización representa un gran potencial de beneficios. La tecnología subyacente detrás de este software de automatización es el flujo de trabajo, conocido como agregador modular de microservicios de API.
Nos diferenciamos por utilizar la producción de contenido de vídeo como punto de entrada, ya que la demanda de producción de contenido de vídeo se está disparando y podemos ver más clientes en este ámbito que tienen problemas con la producción de vídeo. (Gracias TikTok, gracias Instagram, gracias x, vosotros habéis hecho del vídeo el nuevo medio de comunicación).
Si me preguntas cuál es el mayor tesoro de un pirata, creo que sería la Perla Negra. Es posible que las gemas y monedas de oro que tengas delante llenen brevemente tu cartera, pero solo la Perla Negra puede llevarte a encontrar más tesoros infinitos.
ClipZap es tu Perla Negra. En condiciones ideales, puedes equipar tu Perla Negra con tantas piezas de artillería pesada como quieras, como el poderoso generador de vídeos de IA, AI Auto Mixer. O elige al mejor timonel y primer oficial, como el generador de efectos de vídeo con IA o el generador de copias con IA. Una vez hecho esto, podrás navegar por la Perla Negra hasta lugares lejanos, como tu página de destino personalizada, tu plataforma de estanterías de comercio electrónico o una plataforma publicitaria llena de oportunidades y desafíos.
La forma de elegir estas colocaciones es muy importante para usted, no solo brindamos a cada usuario posibilidades ilimitadas de combinaciones y colocaciones, sino que también brindamos a los usuarios un sistema de protección de datos y contenido altamente seguro. Cada paso de los datos y el contenido generados en el flujo de trabajo es rastreable y permitirá ver el historial de visualización en el futuro. Al mismo tiempo, utilizamos las barreras antiataque más seguras del mundo y los proveedores de servicios en la nube más confiables.
Cuando tengas estos superpoderes, estamos seguros de que la Perla Negra te llevará a lugares llenos de tesoros.