2025年12月17日星期三

当一家AI“影视工厂”开始按周“焕新”

分析师/竹心校对/Tina策划/Eason上周,迪士尼宣布向 OpenAI投资 10 亿美元并开放旗下 IP版权授权。传统影视工业的巨头,终于没能抵挡住 AI 魔法的吸引,携其庞大的 IP 矩阵正式入场。原因或许不难理解。走过百年历史的好莱坞,正面临着创意与故事的枯竭。耗资数亿、周期长达数年的大制作频频票房失利,其影响力甚至不及TikTok上日更的宠物短剧。

陈旧的叙事套路与缓慢的内容产出,早已难以匹配年轻一代的观影节奏。AI,或许正是电影工业重焕生机的一剂催化剂?

就在美国AI 巨头与娱乐航母携手的同时,一家来自中国的初创团队,已悄然开启它的冲刺。

12 月 1 日,ELSER.AI 推出主打"新手易上手、高手可精控"的 AI 影视动漫智能体,面向首批邀请码用户启动内测。

仅一周后,12 月 8 日,ELSER.AI 即完成重大版本迭代,一次性上线八大功能:场景与道具一致性维护、高阶口型同步、多模型集成框架、自定义风格化、图像生成工具、视频生成工具、音频处理工具,以及备受关注的"一句话生成短片"智能体视频功能。

12 月 15 日,ELSER.AI 宣布全面开放注册,用户可通过邀请好友获得积分奖励。

从内测到全量上线仅用 15 天?一周内密集发布八大新功能?这背后是一个数百人的团队?程序员彻夜攻坚至凌晨?尽管 AI创业本就处于争分夺秒的竞赛状态,但 ELSER.AI 的推进速度,依然刷新了行业认知。

带着这些疑问,我们深入探访了这家公司与其产品背后的故事。

一、从剧本到动画:Elser.AI如何用智能体重塑短剧创作

传统动画制作流程繁复,涉及剧本、分镜、美术、配音等多环节协作,周期漫长。

Elser.AI正是瞄准这一痛点,试图以AI技术打破这一行业壁垒,最初从文生漫画工具切入,后开发了海外漫剧APP。2025年上半年获得多家机构投资后,团队开始全力研发面向短剧与漫剧的AI智能体。

12月1日,Elser.AI正式上线其首款一站式AI短剧生成智能体,并开放等候名单注册。该平台整合从剧本生成到视频合成的全流程,宣称能在几分钟内将用户的一个简单想法转化为专业级动画短片。

当前,用AI制作一段2-3分钟的精品短剧门槛仍然很高,通常需要组合多种工具、投入大量学时间,并依赖创作者自身的叙事与美术能力。Elser.AI的短剧智能体直指这一痛点,用户仅需提供小说、剧本或初步创意,系统即可自动完成超过90%的工序,涵盖故事扩写、角色设定、分镜绘制、视频生成、配音对口型及剪辑等全链路。

与主流"一键生成"产品不同,Elser.AI深入调研创作流程,设置了"角色库""分镜板""剪辑板"三个核心控制界面。在AI完成初步生成后,创作者仍可通过提示词精细调整人物、构图、运镜等细节,实现"新手简单,高手可控"的设计目标。

"AI不是取代人,而是辅助人,让创意更快落地。"团队这样阐述其理念。其愿景是通过降低技术门槛,让更多人能够高效创作并分享自己的故事。

二、数据验证:静默增长与上线爆发

2025年,智能体(Agent)已成为大模型应用最具潜力的落地形态之一。然而,在不同场景中,Agent面临的困难程度、实现效果与产品形态差异显著。以当下最热门的内容形态——短剧为例,其对大模型与Agent提出的复杂要求,远超一般视频生成任务。

以OpenAI的Sora 2为例,其单次生成可产出10-15秒的高质量短片,但一旦扩展到2分钟乃至上百集的短剧体量,创作者便不得不进行大量重复"抽卡"与繁琐的人工拼接,结果仍难以保证角色、场景、声音、节奏的整体可控。

市面上常见的"类编程"一站式生成Agent在短剧场景中同样表现乏力,大量对质量有要求的创作者,实际上仍停留在"AI手工业时代":手动撰写剧本,在Midjourney中生成图像,用Kling或即梦生成视频片段,通过ElevenLabs合成配音,再借助剪映进行剪辑拼接……流程割裂,效率低下。这也正是许多专业影视创作者至今对AI工具持保留态度的核心原因。

12月1日Elser.AI上线AI短剧智能体后,市场反响迅速:首日涌入用户超过3000人,单周访问量突破1.5万,并持续产生高额付费行为。

面对快速增长,团队并未急于推广,而是将重心转向收集用户反馈,驱动敏捷迭代。反馈主要来自两大群体:

1. 专业创作者(如影视从业者、短剧编导),其诉求集中于高阶可控性:

场景与道具一致性:"人物能保持一致了,但道具和场景呢?总不能吕布的方天画戟变成丈八蛇矛,张小凡的青云山变成蜀山。"

模型与风格定制:"能否集成更多模型?我偏好特定风格。""有没有更贴近'凡人修仙传'的美术风格?"

精准口型同步:"口型为什么对不准?明明想让A角色说话,为什么是B角色的嘴在动?"

2. 创作爱好者(如网文作者、二次元用户),其痛点在于降低操作门槛:

提示词使用:"只想让画面里的小狗显得更萌更小只,该怎么描述?"

镜头语言理解:"如何让两个角色自然地连续对话(实现正反打镜头)?"

基础剪辑需求:"生成的视频有一段冗余,如何快速删除?"

以"口型同步"为例:攻坚复杂需求,加速功能上线

用户的反馈并非意外。实际上,许多痛点在此前长达半年、覆盖数千人的用户调研中已被预见,相关功能开发早已启动。

以用户呼声最高的"高阶口型同步"功能为例,Elser团队为此进行了长达两个月的技术攻坚,探索了多种方案:

纯提示词控制:最简单,但口型与语音难以精准匹配,可控性差。

传统语音驱动视频:需两次生成,耗时漫长且口型容易失真崩坏。

直接使用Sora 2等音画同出模型:虽解决口型生成,但音色与角色表演完全不可控。

最终,团队找到了兼顾易用性与控制力的解决方案。在生成分镜与对白后,用户可开启"高阶口型同步",系统将自动识别画面中所有角色,用户亦可直接框选指定人物。即使在"八仙过海"、"白雪公主与七个小矮人"这类多角色复杂场景中,也能实现"指哪打哪"——精确控制特定角色开口说话。

这项复杂功能原计划于12月底逐步上线。但在接收到海量用户反馈后,Elser团队决定提前发布,连同场景道具一致性、多模型集成、风格自定义等共八大新功能,在12月8日、即产品上线仅一周后,便推送了一次大版本迭代。

三、八大功能闪电上新:Elser.AI如何在两周内重塑AI短剧创作链路

在上一轮"口型同步"的技术攻坚后,Elser.AI并未停下脚步。12月1日产品全量上线带来的用户激增与海量反馈,让这个约30人的团队——其中产研仅20余人——开启了一场与时间赛跑的攻坚战。

他们的目标异常明确:必须在一周内,将此前已在研发中的多项功能打磨至可全量上线的状态,以回应用户最迫切的诉求。

团队迅速拆分为"7+1"的作战单元。CTO带领核心产研团队,负责攻坚"高阶口型同步"、"场景/道具资产库"等七项提升专业创作者效率的深度功能。而CEO刘耕则与一位全栈工程师组成特别小组,挑战一个更具普惠性的目标:开发一款"零基础也能快速生成短片"的智能体视频(Agentic Video)功能。

在五道口略显紧凑的工区内,键盘敲击声此起彼伏,一场围绕"让高手更可控、让新手更简单"的产品迭代狂飙就此展开。

一周后,八项新功能悉数完成并开启内测。又一周后,即12月15日,这些功能已成功整合,随Elser.AI平台全量上线。除了已详细介绍过的"高阶口型同步"功能,Elser.AI此次上新的其余七大功能,可清晰地分为服务于"高手"的深度控制工具与服务于"新手"的便捷入门工具两大类。

(一)面向"高手":三大深度控制功能,实现创意精准落地

1. 场景与道具资产库:构建专属的视觉世界对于长篇叙事,角色、场景与道具的一致性至关重要。Elser.AI上线的资产库功能,允许创作者预先定义并保存关键的场景与道具。在后续分镜设计中,仅需一个"@"符号即可随时调用,确保"李逍遥手中的无尘剑"或"锁妖塔的特定场景"在整个剧集中始终保持一致,从根本上解决了长内容生成中的资产漂移问题。

2. 风格自定义引擎:打造专属视觉名片

尽管平台已内置近50种涵盖动漫、影视、艺术史的视觉滤镜,但为了满足专业创作者对独特美学风格的追求,Elser.AI推出了风格自定义功能。

用户可以基于参考图或详细描述,训练并保存专属风格模型,并将其应用于整个作品。例如,具备中国画背景的CEO刘耕,便亲自创建了独特的"唐伯虎风格",使其作品拥有了极高的辨识度。

3. 多模型集成与严选平台

"多模型集成"看似仅是API调用,但对初创公司而言,在质量、并发、速度与稳定性间取得平衡挑战巨大。Elser.AI建立了包含205项细目的内部美学评估标准,仅人脸评估就涉及7个维度。在此标准下,团队克服了资源限制,接入了包括Seadream、可灵、Minimax、Nano Banana pro、Vidu、Flux Contezt pro、Sora2、Suno等在内的国内外顶尖模型,并计划持续接入Veo、Midjourney等更多选项,为用户提供兼具品质与多样性的生成选择。

(二)面向"新手":四项便捷工具,大幅降低创作门槛

4. 一体化生图工具

对于初学者,直接创作动画可能门槛过高。新上线的生图工具允许用户通过自然语言描述.............

原文转载:https://fashion.shaoqun.com/a/2579076.html

巴基斯坦的清关 巴基斯坦的海运港口 巴基斯坦的海运 巴基斯坦的外贸 巴基斯坦的国际物流 巴基斯坦物流陆运 TikTok Shop 实操运营全流程解析:从起号到稳定出单的关键细节 墨西哥对华1400+商品最高加税50%,转口贸易大崩溃?(附对墨出口榜单)

没有评论:

发表评论