一、大型活动所面临的技术挑战CNY(春节活动)是快手重要的年度专项之一。平台在春节期间推出多种互动玩法,内容会场作为预热、除夕和留存阶段的核心载体,先后支撑了“快手有年味”、“老铁晚会”、“龙之页”、“明星陪你过大年”等多项活动。这些页面以内容消费为主,致力于将内容与玩法创新结合,以更好地实现业务目标。快手低代码搭建平台(简称“积木”)是快手核心的运营活动页面构建基础设施,目前已承担90%以上的活动...
2025-09-29 16:40:24 804浏览 0点赞 0回复 0收藏
数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。然而,现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。大多数系统要么计算开销巨大,无法实时响应,要么只能处理单一模态输入,缺乏真正的交互能力。为了解决这些问题,快手可灵团队(KlingTeam)提出了一种名为MIDAS(MultimodalInteractiveDigitalhumanSynthesis)的新型框架,通过自回归视频生成结合轻量化扩散去噪头,实现了多模态条件...
2025-09-24 18:21:53 2428浏览 0点赞 0回复 0收藏
在实时竞价(RTB)广告系统中,广告出价模块作为连接广告主需求与流量匹配的核心枢纽,需要将广告主的营销目标(如转化率、ROI)转化为动态竞价决策。作为竞价机制的中枢神经,广告出价不仅直接影响广告主的投放效果,也是广告排序分的关键组成模块,进而影响平台侧的流量分配效率。广告出价的面临的核心挑战可以概括为以下三点:既要花钱,又要省着花:广告主既需控制单日花费不超预算,又需尽可能降低每次转化(如购买、下载...
2025-09-24 12:24:18 1444浏览 0点赞 0回复 0收藏
让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。观众看到的不再只是嘴在动,而是整个人在表演。这种表现不仅限于几个片段,而是能够稳定地延续到分钟级长视频中,在整段时间里保持动作自然、镜头流畅。近日,快手可灵团队把这一构想带到了现实。全新数字人功能已在可灵平台正式上线(h...
2025-09-19 17:13:04 5605浏览 0点赞 0回复 0收藏
还有一个月,一年一度的“双十一”就要来了!作为消费者,你平时是怎样寻找心仪商品的呢??当你满怀期待在搜索框输入关键词,却发现商品列表并不符合心意——这背后到底是什么原因导致的?这一切,还要从电商平台常用的传统搜索架构说起。目前主流系统采用召回>粗排>精排”的级联式架构。召回层:比如你搜索“红色连衣裙”,系统会迅速从数亿商品中筛选出上万个包含“红色”“连衣裙”关键词的商品。这步追求快和全,但精度不...
2025-09-19 11:54:56 1772浏览 0点赞 0回复 0收藏
快手正式发布了多模态大语言模型KeyeVL1.58B。与之前的版本相比,KeyeVL1.5的综合性能实现显著提升,尤其在基础视觉理解能力方面,包括视觉元素识别、推理能力以及对时序信息的理—表现尤为突出。KeyeVL1.5在同等规模的模型中表现出色,甚至超越了一些闭源模型如GPT4o。KeyeVL1.58B在技术上实现了三项关键创新:引入慢快编码策略(SlowFast):该策略基于相似性算法自动区分慢帧与快帧,并将快帧的token预算控制为慢帧的30%。同...
2025-09-08 18:01:19 2109浏览 0点赞 1回复 0收藏
导读:快手KwaiKeye团队提出Thyme(ThinkBeyondImages)的新范式,并围绕它构建了一整套技术方案。旨在突破现有方法的限制,赋予开源模型一种更强大、更自主、功能更全面的“超越图像思考”的能力。OpenAI推出的o3推理模型,首次将图像直接融入推理过程,开创了视觉文本联合推理的新范式。该能力(ThinkwithImage)自发布以来,受到业界与学术界的广泛关注,多项研究开始探索如何在推理中引入视觉信息以增强模型感知与推理...
2025-08-29 17:03:29 1483浏览 0点赞 0回复 0收藏
近日,快手Kwaipilot团队发布了SeamlessFlow技术报告,这是对团队所使用的工业级规模强化学习(RL)训练框架的详细介绍。该框架通过创新的数据平面架构,对RL的训练逻辑和Agent做了彻底解耦,用以支持多智能体、在线强化学习训练等复杂场景;更进一步,针对RL计算资源分配问题,团队提出了“标签分配机制”,统一了该领域最广泛的两种设计模式(训推共卡、训推分离)。以标签分配的思路为出发点,在业界首个提出“时空复用pipel...
2025-08-29 16:20:42 1520浏览 0点赞 0回复 0收藏
在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从OpenAI最早将RLHF引入大模型训练,到DeepSeek提出GRPO算法,我们见证了强化学习在推理模型领域的巨大潜力。然而,想要复现这些顶尖成果,并不只是“多喂点数据、跑几轮训练”这么简单。现实是,很多中小规模的开源推理模型,在AIME这样的高难数学竞赛题、或LiveCodeBench这样的复杂代码评测中,依然与闭源SOTA存在明显差距。最近,快手Klear语言大模型...
2025-08-19 18:15:00 1895浏览 0点赞 0回复 0收藏
近日,快手8篇论文入选人工智能数据挖掘领域顶会KDD2025,研究涵盖推荐系统、多任务学习、多模态大模型、大语言模型、组合优化等前沿领域的成果。KDD(ACMSIGKDDConferenceonKnowledgeDiscoveryandDataMining)是人工智能数据挖掘领域的国际顶级学术会议。该会议一年举办一次,由ACM的数据挖掘及知识发现专委会主办。KDD2025将于2025年8月3日至7日在加拿大举办。近日,大会正式公布论文录取结果,快手凭借在人工智能领域的持续...
2025-08-05 15:49:15 4197浏览 0点赞 0回复 0收藏
一、项目背景当前在线推理服务架构中,计算节点(推理服务)与存储节点(在线PS服务)之间存在海量的实时数据传输需求。随着模型参数量剧增,传统分布式架构需扩展到成千上万个服务节点,导致计算节点访问存储节点的带宽散出激增,进而推高访问延迟。加之当前主流的TCP网络通信存在CPU占用高、延迟高、吞吐低等劣势,严重制约了服务响应时间,限制了模型预估机器的横向扩展(ScaleOut)规模。结合快手的业务需求,我们的目标是...
2025-07-23 17:09:07 1907浏览 0点赞 0回复 0收藏
近日,快手发布并开源了KATV1自动思考(AutoThink)大模型,这是一款融合思考与非思考能力、并且可以根据问题难度自动切换思考形态的模型。KATV1模型共有40B和200B两个版本。在自动思考模式下,40B版本的性能可追平今年5月发布的新版DeepSeekR1(参数量为6850亿)。而200B版本的模型,则在多项基准测试中超过了Qwen、DeepSeek和Llama这三大开源模型家族中的旗舰模型。值得一提的是,在号称无法作弊的竞赛级实时基准测试LiveCode...
2025-07-22 13:26:26 2664浏览 0点赞 0回复 0收藏
导读:本文以快手天守平台核心建设者视角,系统梳理了大规模前端工程质量保障体系的演进路径。通过解构其分层架构设计、分布式调度引擎等关键技术组件,深度剖析平台在应对亿级DAU场景下的工程实践,为行业提供可借鉴的质量保障体系建设范式。即使你的工厂被拆除了,只要它的精神还在,你就能很快重新建立起另一家。如果一场革命摧毁了旧政府,但新政府思想和行为的系统模式没有变化,它就仍然难逃再次被推翻的命运。关于系...
2025-07-17 14:27:04 1119浏览 0点赞 0回复 0收藏
在自然语言处理中,自回归建模(AutoregressiveModeling,AR)凭借其"NexttokenPrediction"的方式,已在GPT、LLaMA等大语言模型中取得了突破性成果。受此启发,业界开始将自回归方法从语言迁移到视觉领域,在图像生成领域(DALL·E、GPT4o)也表现出了巨大的潜力。相较于基于扩散模型(DiffusionModel)的生成方式,自回归的方式更加有效地建模多模态信息,同时避免噪声采样的随机性,进而生成更加稳定的结果。为了将自回归建模...
2025-07-14 17:28:41 3945浏览 0点赞 0回复 0收藏
计算机视觉领域顶级会议InternationalConferenceonMachineLearning(ICML2025)将于7月13日至7月19日在加拿大温哥华召开,快手音视频技术团队联合南京大学发表的题为《UltraLowrateImageCompressionwithSemanticResidualCodingandCompressionawareDiffusion》——基于语义残差编码与压缩感知扩散的超低码率图像压缩的最新研究成果被会议收录。ICML是机器学习领域的顶级国际会议,其收录的论文代表了机器学习基础理论与算法创新的...
2025-07-10 17:32:13 2374浏览 0点赞 0回复 0收藏
导读:快手8篇论文入选机器学习领域顶会ICML2025,研究涵盖了多模态情感大模型、机器学习单调建模、因果效应估计结果、级联排序系统一体化建模、统一生成理解框架、图像压缩、图像超分等前沿领域的成果。ICML(InternationalConferenceonMachineLearning)作为机器学习领域的全球顶级学术盛会,由国际机器学习学会(IMLS)主办,并被中国计算机学会(CCF)列为A类国际权威会议。第42届ICML将于7月13日至19日在温哥华会议中...
2025-07-08 17:05:00 1866浏览 0点赞 0回复 0收藏
测试时扩展(TestTimeScaling)极大提升了大语言模型的性能,涌现出了如OpenAIo系列模型和DeepSeekR1等众多爆款。那么,什么是视觉领域的testtimescaling?又该如何定义?为了回答这一问题,最近香港科技大学联合快手可灵团队推出EvolutionarySearch(EvoSearch)方法,通过提高推理时的计算量来大幅提升模型的生成质量,支持图像和视频生成,支持目前最先进的diffusionbased和flowbased模型。EvoSearch无需训练,无需梯度...
2025-07-03 17:27:56 1158浏览 0点赞 0回复 0收藏
导读:快聘业务快速发展情况下,图文AIGC模板生产人力紧缺,技术借助码灵D2C和增长合图能力搭建伏羲工作台,助力实现业务模板快速自动化生产,推动了业务形态发展。一、背景介绍业务背景“快聘”是快手于2022年推出覆盖蓝领群体的短视频平台蓝领招聘业务。通过构建以信任为中心的蓝领招聘关系和直播带岗模式,为用工企业和蓝领用户搭建就业平台。快手“快聘”早期叫“快招工”,进行品牌升级后叫“快聘”,自推出后,已为比亚迪...
2025-06-27 18:04:36 1560浏览 0点赞 0回复 0收藏
导读:近日,快手发布并开源其最新自研的多模态大语言模型KwaiKeyeVL。KwaiKeyVL采用VisionEncoderProjectorLLM架构,集成了文本、图像、视频信息的混合输入处理能力,旨在为用户带来更智能、更全面的多模态交互体验。如果有人突然问你:「这张图片中有几颗草莓」?你会如何快速回复?面对五彩缤纷的果盘,我们往往需要反复端详,放大图片再逐一清点,耗费不少时间才能得到答案。然而,AI大模型正让这种复杂视觉识别变得简单—...
2025-06-27 15:39:52 2654浏览 0点赞 0回复 0收藏
导读:大模型技术正深刻重塑商业风控体系,推动风险管理向智能化、高效化、精准化转型。本系列专题首篇聚焦快手商业化风控内容审核场景,系统剖析大模型如何破解传统风控痛点,构建覆盖全链路的风险治理新范式。后续篇章还将进一步揭秘大模型评估标准Bechmark、智能体Agent、多模态推理模型等内容,敬请期待。一、引言快手商业化场景下,风险控制不仅关乎平台的信誉和经济效益,更直接影响用户和客户的体验和利益。理想的风控系...
2025-06-25 17:00:32 2192浏览 0点赞 0回复 0收藏