
文 | 字母 AI
AI 视频这条赛谈,最近有点冷,Seedance 2.0 堕入版权争议,OpenAI 关停 Sora ,让这条赛谈上空黯淡密布。
就在这个时候,阿里牵出来了一匹黑马。
2026 年 4 月,HappyHorse-1.0 冲上 Artificial Analysis 榜首,在文生视频和图生视频(无音频)两个赛谈同期压过字节、快手等敌手。
张迪在 2025 年 11 月回来阿里巴巴,接任淘天集团翌日生计实验室厚爱东谈主一职,并径直向阿里姆妈 CTO 郑波陈述责任。
也即是说,张迪从回来到闯出神气,中间也就隔了 5 个月支配。
关键在于,HappyHorse 和阿里的千问一样,洞开了可商用的开源版块。
当前千问在阿里什么地位?它是阿里集团级的中枢通用大模子底座、AI 政策的弥散中枢载体。阿里现如今的一切,皆是在围绕千问进行布局。
是以 HappyHorse 对阿里的意旨,可能也远不啻是一个刷榜秀本事的模子那么浅易。
不外在贯通阿里的主张之前,咱们应该先来聊聊,张迪是谁。
01 从阿里到快手再回阿里
张迪毕业于上海交通大学策动机专科,本硕连读,2010 年毕业后加入阿里巴巴,持久厚爱阿里姆妈的大数据和机器学习工程架构。
阿里姆妈作念的是告白、推选、搜索和滚动,背后是大领域数据、大领域分发和复杂工程系统。这些东西听起来莫得大模子那么扯后腿,但它们恰是自后中国互联网公司教训 AI 东谈主才的场地。
许多委果能把模子作念成产物的东谈主,并不是纯正从实验室里出来的。他们更早资格过搜索、推选、告白、本体分发这些系统的谨慎。
这我果决举几个例子你就懂了。谷歌 CEO 桑达尔 · 皮查伊,他即是作念搜索栏和 Youtube 本体推选出身的,微软的 CEO 萨提亚 · 纳德拉,他在微软一初始开荒的即是必应搜索引擎和微软告白体系。
因为这些系统每天皆在处理海量用户行动,也条目模子能在委果业务里贯通运行。它不允许工程师只作念一个顺眼的 demo,它免强你作念出委果有用的东西出来,还必须在蔓延、资本、效力、响应之间反复遴选。
张迪在阿里的十年,好像即是在这么的环境里渡过的。那时候外界还莫得把所有事情皆叫作大模子,但阿里里面早就有一套围绕数据、算法和工程化的教训场。
2020 年,张迪离开阿里去了快手。
那时的短视频平台,依然从流量竞争参加本事竞争阶段。张迪在快手历任本事副总裁、大模子与多媒体本事团队厚爱东谈主,自后主导了可灵大模子的底层架构研发和期骗落地。
可灵对快手的意旨黑白常要紧的。
可灵让快手从夙昔的 "本体分发平台",升级为 "本体分娩基础设施提供商",构建了 "创意生成 - 视频制作 - 一键分发 - 流量变现 - 数据迭代" 的齐全闭环
2025 年 4 月,快手竖立可灵 AI 业绩部,并升级为公司一级部门,径直向 CEO 程一笑陈述,与短视频主业务平起平坐。
是以当他在 2025 年 9 月片晌加入 B 站,又在两个月后回到阿里时,这个动作就很难只行为一次粗浅的东谈主才流动。
B 站需要视频本事,阿里相似需要视频本事,仅仅阿里的需求更复杂。
快手作念视频生成,无非即是分发。但阿里淌若作念视频生成,那背后牵扯的重要就多了去了。有电商、告白、直播、云就业和国外商家。
前文提到,张迪 2025 年 11 月回来阿里后,出任淘天集团"翌日生计实验室"厚爱东谈主,职级 P11。
如斯安排下来,阿里味照旧很浓的。它莫得把视频模子浅易放在一个纯究诘部门里,其位置反而更合股淘天这么一个交往现场。
换句话说,HappyHorse 从构想初始,即是一个强调落地,和阿里现存生态绑定的产物。
五个月后,HappyHorse 出现了。
这个速率确乎快,阿里给了张迪一个新的业务场景和团队,他把视频模子这条道路再次买通。
他既不是从零初始参加 AI 视频,也不是单纯从外部空降到阿里。
他的办事旅途像一条绕出去又绕回来的线。先在阿里学会大领域交易系统若何运转,再去快手把视频生成作念成产物,然后又回到阿里,把这套才调放进更大的交易机器里。
许多公司皆在抢大模子东谈主才,但委果稀缺的东谈主,经常是能同期贯通模子、业务和组织的东谈主。
单纯会教训模子的东谈主许多,单纯会讲政策的东谈主也许多,难的是有东谈主知谈一个模子从本事道路初始,到架构打算,到教训推理,到产物出口,到临了被商家和用户用起来,中间每一步会在那处卡住。
HappyHorse 把张迪再行推到台前,也让阿里夙昔几年相对散播的 AI 叙事有了一个更具体的东谈主物进口。
02 开源模子如何打败闭源巨头
HappyHorse 委果引起热心的点,在于它获得太霎时了。
在视频生成这条赛谈上,国外有 Runway、Pika、Luma、Google 的 Veo,国内有字节的 Seedance、快手的可灵。阿里排不上号。
是以当 HappyHorse 刚屠榜的时候,全球致使更闲静校服说这是某创业公司开荒的模子,也不肯意校服这是阿里的模子。
HappyHorse 在文本转视频和图像转视频两个赛谈皆处在第一梯队,文本转视频 Elo 分数为 1333,图像转视频 Elo 分数为 1392。
Artificial Analysis 的榜单自身会随用户盲测不休变化,后续页面分数也有更新,然而它确乎在用户偏好测试中压过了一批更早出名的闭源模子。
这事其实挺反常的。豪迈来说,视频生成是最吃钱、吃数据、吃算力的标的之一。
闭源大厂不错把数据、模子细节、推理系统和产物体验藏在我方平台里,捏续作念里面迭代。
开源模子则要靠近更多践诺戒指,它的参数要能公开,推理要能跑起来,社区要能复现,效力还要经得起横向比拟。
是以在 HappyHorse 出现之前,开源视频模子大多数皆是玩物,输出的视频不够贯通,东谈主物还经常会出现漂移。
HappyHorse 有 150 亿参数、40 层息争自注重力 Transformer 架构,把文本、视频、音频三种模态的 token 放进合并个序列里合股建模。
这个路数和千问绝顶像,这也就证明了为什么张迪仅用 5 个月就把 HappyHorse 弄出来了,很可能是沿用千问留住来的高质料原生多模态教训顺次。
像 Sora 这种非多模态原生的视频生成模子,经常会出现东谈主物嘴在动,声息慢半拍的情况。况且有时候东谈主物神气很丰富,乐鱼体育但口吻分别。东谈主物还有可能在声息发出之前就行动了。
HappyHorse 评分高的原因就在于,它通过原生多模态处置了这个问题。
HappyHorse 原生赈济英语、粗浅语、粤语、日语、韩语、德语、法语等多种语言的唇形同步,词演叨率也被拿来和同类开源模子比拟。
张迪为什么要这么作念?我的贯通是,如果阿里想让视频生这项本事参加告白、电商、短剧、教训和直播,就弗成只靠画面漂亮。
它要能语言,要能配音,要让声息和画面同期竖立。
另一个关键点是资本和速率。
HappyHorse 在单张 H100 GPU 上生成 5 秒 1080p 视频约需 38 秒,并经受 DMD-2 蒸馏本事把去噪才调压到 8 步。
这是视频生成交易化绕不开的沿路坎。模子效力再好,如果生成一条短视频资本太高、恭候太久,就很难参加商家日常责任流。
商家不会为每个商品等半天,也不会为几十个测试素材支付过高资本。
是以 HappyHorse 的意旨不仅仅"能生成",还在于它试图把生成速率和推理资本压到可用区间。
对开荒者来说,开源意味着不错自托管、微调、接入我方的产物。对平台来说,开源也会带来更多社区响应
一个闭源模子的超越主要依靠公司里面团队,一个开源模子会被开荒者拿去作念各式奇怪测试,问题流露得快,校正标的也会变多。
Artificial Analysis 的视频竞技场经受用户偏好投票,许多时候不单看某一个本事目标,更看用户在两段视频之间更心爱哪一个。
自然,张迪还弗成太骄气,一次榜单登顶不等于永远最初。
竞争敌手不会停在原地。HappyHorse 当前赢下的仅仅一场公开测试,还不是通盘干戈。
HappyHorse 如果仅仅一个能刷榜的模子,它的意旨有限。可如果它能成为阿里云、淘天业务共同使用的视频生成底座,它就会酿成一个进口。
是以说 HappyHorse 打败闭源巨头,最故真谛的场地并不仅仅分数最初。真适值得热心的是,它让阿里找到了一种再行参加视频生成牌桌的模式。
它莫得先作念一个面向 C 端用户的 APP,也莫得只在里面作念演示,而是径直拿开源模子经受全行业测验。
这场得胜恐怕会捏续很久,但张迪让外界更正了对阿里在视频生成模子上的判断。
新的问题酿成了,阿里准备把这项才调用到那处?
03 HappyHorse 对阿里的意旨
HappyHorse 最径直的落点,是电商。
夙昔全球谈 AI 视频,最容易预料影视、短剧、告白大片、创作家器用。诚然,这些皆是实打实的大商场,不外它们离阿里的主业务还有一段距离。
阿里的上风不在于我方作念一个视频社区,也不在于让粗浅用户每天大开一个 AI 视频 APP 消磨时辰。阿里委果有上风的场地,是它手里有中国最密集的商品、商家、交往和告白系统。
这亦然为什么许多东谈主皆介怀说 HappyHorse 出身于淘天集团的"翌日生计实验室"。
淘天每天靠近的是商家若何卖货,商品若何被看见,用户为什么点进来,又为什么下单。HappyHorse 放在这里,全球自然就会预料它能弗成普及商品本体分娩效力,能弗成普及滚动,能弗成帮平台多作念生意?
对一个粗浅商家来说,视频本体一直是个困难事。
拍一条 30 秒的商品视频,你要找场景、找模特、打光、裁剪、配音。大品牌不错请团队,中小商家更多时候只可我方凑。
许多商品卖点并不复杂,问题在于没东谈主把卖点拍出来。它们放在白底图里皆很粗浅,一朝参加具体场景,用户才会意志到它能用来作念什么。
前一阵在国外,太阳能喷泉泵这个产物卖爆了,它正本仅仅庭院小件,效力也就那么回事。然而被 AI 视频包装成鸟浴盆、鱼池和儿童浴缸里,酷炫的喷水玩物后,所有东谈主皆在疯抢。

AI 莫得更正商品自身,却更正了用户贯通商品的模式。它把"功能证明"酿成了"使用场景"。
这正好击中电商本体的痛点。
商品页里写满参数,用户恐怕有耐性看;主播讲半天,用户也恐怕校服。但一条十几秒的视频,如果能把场景讲了了,滚动效力可能会高许多。
更迫切的是,AI 视频不错批量生成。商家不错为合并个商品生成儿童版、家庭版、节日版、户外版,也不错为不同国度生成不同语言、不同东谈主物、不同场景。
这对阿里的意旨,比单纯作念一个视频生成器用要大。不管是淘宝,照旧天猫,上头皆有多半商家,也皆有多半商品数据和交往响应。
一个 AI 视频器用如果只知谈生成漂亮画面,它很快会酿成素材软件;如果它能知谈这个商品在什么场景下更容易被点击,什么案牍更容易带来加购,什么视频前几秒更容易留住用户,它就会接近电商操作系统的一部分。
阿里比其他视频生成模子公司多出来的,恰是这个响应闭环。
商品图、细目页、评价、问答、搜索词、点击率、加购率、退款原因、直播间停留时辰,这些东西看起来龙套,却皆是教训电商本体才调的燃料。
HappyHorse 如果接入这些响应,就不错从"帮商家生成一条视频",进化到"帮商家生成更可能卖货的视频"。
面向淘天,它不错作念主图视频、商品场景短片、直播切片、诬捏主播和营销素材。
夙昔一个商家上新,可能只上传几张图,最多再拍一条简单短视频。以后它不错把商品图、卖点、评价和东谈主群标签交给系统,让系统生成多条不同版块的视频,再用委果投放和成交数据筛选出更有用的那一条。
这个经由如果跑顺了,平台本体供给会炫耀增多,中小商家的本体门槛也会着落。
不外,AI 视频带货也有风险。它不错放大卖点,也可能放大幻觉。一个喷泉泵在 AI 视频里喷得很高,践诺里够不上那样的效力。
阿里的契机不该是淘气商家用 AI 造梦,要点应该放在商品参数、实拍素材、买家评价和平台审核上,让生成本体有鸿沟。
3 月下旬,OpenAI 告示关停 Sora 孤苦期骗和关系 API。原因很践诺,视频生成太烧钱,用户留存撑不起资本,OpenAI 要把算力放回编码、企业就业和机器东谈主标的。
Sora 倒在了交易账上。
字节也在另一头际遇困难。Seedance 2.0 自然效力也很猛,然而因为版权问题,字节暂停了 Seedance 2.0 的全球发布。
模子教训得越强,就越容易踩进版权、肖像权和教训数据的泥潭。
这时再看张迪带队作念出的 HappyHorse,它有显露的交易场景。而且阿里手里的商品图、商家素材、实拍视频和交往响应,自然比影视 IP 更适合可控生成。
是以 HappyHorse 的价值leyu体育,不单在榜单。它给 AI 视频找了一个更稳的落点。
凤凰彩票官网首页 - Welcome
