|
|
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
澳洲金融时报:TikTok如何让中国AI公司在视频领域领先美国对手
AFR北京小溪,中国人工智能公司已在视频生成领域领先美国竞争对手。视频生成是生成式AI的关键战场,正在广告、电商和娱乐领域迅速普及。
总部位于北京的字节跳动和快手等公司,正在利用庞大的短视频库训练系统,使它们相较美国竞争对手拥有优势。
这一转变标志着AI竞赛出现分化:OpenAI、谷歌和Anthropic仍主导大型语言模型以及编码等领域,但据开发者和多个使用排行榜显示,它们的视频工具在质量和可用性方面落后于中国产品。
训练视频模型需要大量高质量影像素材,而中国平台通过拥有TikTok等短视频应用及其产生的数据,在这一领域具备优势。一些专家认为,中国公司在获取受版权保护材料方面也更加激进。
Director AI创始人Ben Chiang表示:“我们尝试过的大多数美国模型,在视频生成方面都不是很好。”
Director AI是一家制作AI生成内容的初创公司,产品包括动画片和短剧。他说,更严格的内容控制限制了美国工具,而且往往生成不够真实的结果。
Director AI主要使用快手开发的可灵(Kling),同时也会根据任务和成本,在字节跳动的Seedance 2.0和初创公司MiniMax的Hailuo之间切换。
蒋说:“归根结底取决于质量,以及模型遵循提示词的能力。”他补充说,近期进展让这些工具使用起来更加顺畅,尤其是在音频同步和声音稳定方面。
对创作者来说,这些改进已经在重塑制作流程。身在格鲁吉亚第比利斯的独立AI电影制作人和剪辑师George Won表示:“Seedance 2.0彻底改变了我的创作自由。”
“它能处理激烈的镜头角度和速度,同时不会丢失角色面部或灯光对比。大多数AI模型在画面快速移动时,都会开始晃动或漂移。”
在Arena根据独立平台用户投票编制的最佳视频模型排名中,可灵、Seedance 2.0和HappyHorse 1.0都获得高分。这类评估被认为比大多数模型基准测试系统更可靠,因为AI实验室会针对基准测试进行优化,而这些基准未必准确反映模型在现实世界中的表现。
谷歌的Veo 3模型也具有竞争力。专家称,该模型因能够接触YouTube视频素材而拥有优势,但它对开发者设置了更多内容保护措施和限制。
这些进展的基础,是能够获取海量专有视频数据。字节跳动和快手运营着全球最大的几个短视频平台,这给它们带来了难以被竞争对手复制的训练优势,尤其是视频内容不同于文本,无法轻易大规模抓取。
法律威胁
上周,快手宣布正研究分拆可灵业务的选项,并可能寻求单独上市,以利用其快速增长的AI视频业务。
这类材料的使用也引发审查。字节跳动因涉嫌侵犯版权而面临法律威胁,原因是其允许用户在未经适当许可的情况下,创作含有漫威电影和电视剧《南方公园》等角色的视频。这家中国互联网集团已承诺加强保护措施。
多名开发者和创作者表示,较宽松的内容限制让中国模型在实际使用中更方便。蒋说,美国工具会“不断出错”,以违反使用条款为由拒绝请求,却不作进一步解释。
对个人创作者来说,中国平台通常比西方替代产品更便宜、更灵活,提供订阅制或按量付费系统,使用户能够快速试验。不过,自2月以来,Seedance 2.0需求旺盛,导致部分用户使用受限,并面临漫长等待时间。
对企业客户而言,字节跳动采取了不同做法。据知情人士称,对于部分美国客户,字节跳动要求较高的预付款承诺,要求客户支付约200万美元,即280万澳元,用于获得访问权限和额度分配。字节跳动没有回应置评请求。
一些用户会通过BeHooked等第三方平台访问这些模型,从而绕过这些障碍。这些平台会重新包装模型,并提供其它定价结构。
生成视频所需的token,也就是AI模型处理的数据单位,远多于文本或音频,因此大规模部署成本高昂。今年3月,OpenAI停止提供其Sora视频生成模型,部分原因正是高昂的计算成本。
质量飞跃
对基于这项技术进行开发的公司来说,近期质量飞跃正在打开商业机会。
为电商网站提供视频基础设施的Firework首席执行官Vincent Yang表示:“以前,这些视频很尴尬、很机械,无法达到品牌标准。现在我们已经到了分不清这是AI还是人类制作的阶段。”
杨说,这项技术已经在重塑广告,因为它让品牌能够以前所未有的规模生成视频。
他说:“有一家零售商要求我们为它的产品页面制作10万个视频。如果没有AI,这将贵得让人难以承受。现在,每一件产品都可以拥有自己的视频,甚至可以为不同客户定制多个版本。”


来源:
https://www.afr.com/world/asia/h ... deo-20260518-p5zxzg
Eleanor Olcott
May 18, 2026 – 1.10pm |
|