快手技术
LV.3
快手官方账号,发布最新技术实践。微信关注“快手技术“了解详情
声望 378
关注 0
粉丝 3
私信
主帖 35
回帖
​导读:快手KwaiKeye团队提出Thyme(ThinkBeyondImages)的新范式,并围绕它构建了一整套技术方案。旨在突破现有方法的限制,赋予开源模型一种更强大、更自主、功能更全面的“超越图像思考”的能力。​​OpenAI推出的o3推理模型,首次将图像直接融入推理过程,开创了视觉文本联合推理的新范式。该能力(ThinkwithImage)自发布以来,受到业界与学术界的广泛关注,多项研究开始探索如何在推理中引入视觉信息以增强模型感知与推理...
21h前 213浏览 0点赞 0回复 0收藏
近日,快手Kwaipilot团队发布了SeamlessFlow技术报告,这是对团队所使用的工业级规模强化学习(RL)训练框架的详细介绍。该框架通过创新的数据平面架构,对RL的训练逻辑和Agent做了彻底解耦,用以支持多智能体、在线强化学习训练等复杂场景;更进一步,针对RL计算资源分配问题,团队提出了“标签分配机制”,统一了该领域最广泛的两种设计模式(训推共卡、训推分离)。以标签分配的思路为出发点,在业界首个提出“时空复用pipel...
21h前 258浏览 0点赞 0回复 0收藏
在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从OpenAI最早将RLHF引入大模型训练,到DeepSeek提出GRPO算法,我们见证了强化学习在推理模型领域的巨大潜力。然而,想要复现这些顶尖成果,并不只是“多喂点数据、跑几轮训练”这么简单。现实是,很多中小规模的开源推理模型,在AIME这样的高难数学竞赛题、或LiveCodeBench这样的复杂代码评测中,依然与闭源SOTA存在明显差距。最近,快手Klear语言大模型...
2025-08-19 18:15:00 1509浏览 0点赞 0回复 0收藏
近日,快手8篇论文入选人工智能数据挖掘领域顶会KDD2025,研究涵盖推荐系统、多任务学习、多模态大模型、大语言模型、组合优化等前沿领域的成果。KDD(ACMSIGKDDConferenceonKnowledgeDiscoveryandDataMining)是人工智能数据挖掘领域的国际顶级学术会议。该会议一年举办一次,由ACM的数据挖掘及知识发现专委会主办。KDD2025将于2025年8月3日至7日在加拿大举办。近日,大会正式公布论文录取结果,快手凭借在人工智能领域的持续...
2025-08-05 15:49:15 3190浏览 0点赞 0回复 0收藏
一、项目背景当前在线推理服务架构中,计算节点(推理服务)与存储节点(在线PS服务)之间存在海量的实时数据传输需求。随着模型参数量剧增,传统分布式架构需扩展到成千上万个服务节点,导致计算节点访问存储节点的带宽散出激增,进而推高访问延迟。加之当前主流的TCP网络通信存在CPU占用高、延迟高、吞吐低等劣势,严重制约了服务响应时间,限制了模型预估机器的横向扩展(ScaleOut)规模。结合快手的业务需求,我们的目标是...
2025-07-23 17:09:07 1332浏览 0点赞 0回复 0收藏
近日,快手发布并开源了KATV1自动思考(AutoThink)大模型,这是一款融合思考与非思考能力、并且可以根据问题难度自动切换思考形态的模型。KATV1模型共有40B和200B两个版本。在自动思考模式下,40B版本的性能可追平今年5月发布的新版DeepSeekR1(参数量为6850亿)。而200B版本的模型,则在多项基准测试中超过了Qwen、DeepSeek和Llama这三大开源模型家族中的旗舰模型。值得一提的是,在号称无法作弊的竞赛级实时基准测试LiveCode...
2025-07-22 13:26:26 2227浏览 0点赞 0回复 0收藏
导读:本文以快手天守平台核心建设者视角,系统梳理了大规模前端工程质量保障体系的演进路径。通过解构其分层架构设计、分布式调度引擎等关键技术组件,深度剖析平台在应对亿级DAU场景下的工程实践,为行业提供可借鉴的质量保障体系建设范式。​​即使你的工厂被拆除了,只要它的精神还在,你就能很快重新建立起另一家。如果一场革命摧毁了旧政府,但新政府思想和行为的系统模式没有变化,它就仍然难逃再次被推翻的命运。关于系...
2025-07-17 14:27:04 781浏览 0点赞 0回复 0收藏
在自然语言处理中,自回归建模(AutoregressiveModeling,AR)凭借其"NexttokenPrediction"的方式,已在GPT、LLaMA等大语言模型中取得了突破性成果。受此启发,业界开始将自回归方法从语言迁移到视觉领域,在图像生成领域(DALL·E、GPT4o)也表现出了巨大的潜力。相较于基于扩散模型(DiffusionModel)的生成方式,自回归的方式更加有效地建模多模态信息,同时避免噪声采样的随机性,进而生成更加稳定的结果。为了将自回归建模...
2025-07-14 17:28:41 2999浏览 0点赞 0回复 0收藏
计算机视觉领域顶级会议InternationalConferenceonMachineLearning(ICML2025)将于7月13日至7月19日在加拿大温哥华召开,快手音视频技术团队联合南京大学发表的题为《UltraLowrateImageCompressionwithSemanticResidualCodingandCompressionawareDiffusion》——基于语义残差编码与压缩感知扩散的超低码率图像压缩的最新研究成果被会议收录。ICML是机器学习领域的顶级国际会议,其收录的论文代表了机器学习基础理论与算法创新的...
2025-07-10 17:32:13 1757浏览 0点赞 0回复 0收藏
导读:快手8篇论文入选机器学习领域顶会ICML2025,研究涵盖了多模态情感大模型、机器学习单调建模、因果效应估计结果、级联排序系统一体化建模、统一生成理解框架、图像压缩、图像超分等前沿领域的成果。​​ICML(InternationalConferenceonMachineLearning)作为机器学习领域的全球顶级学术盛会,由国际机器学习学会(IMLS)主办,并被中国计算机学会(CCF)列为A类国际权威会议。第42届ICML将于7月13日至19日在温哥华会议中...
2025-07-08 17:05:00 1308浏览 0点赞 0回复 0收藏
测试时扩展(TestTimeScaling)极大提升了大语言模型的性能,涌现出了如OpenAIo系列模型和DeepSeekR1等众多爆款。那么,什么是视觉领域的testtimescaling?又该如何定义?​为了回答这一问题,最近香港科技大学联合快手可灵团队推出EvolutionarySearch(EvoSearch)方法,通过提高推理时的计算量来大幅提升模型的生成质量,支持图像和视频生成,支持目前最先进的diffusionbased和flowbased模型。​EvoSearch无需训练,无需梯度...
2025-07-03 17:27:56 794浏览 0点赞 0回复 0收藏
导读:快聘业务快速发展情况下,图文AIGC模板生产人力紧缺,技术借助码灵D2C和增长合图能力搭建伏羲工作台,助力实现业务模板快速自动化生产,推动了业务形态发展。一、背景介绍业务背景“快聘”是快手于2022年推出覆盖蓝领群体的短视频平台蓝领招聘业务。通过构建以信任为中心的蓝领招聘关系和直播带岗模式,为用工企业和蓝领用户搭建就业平台。快手“快聘”早期叫“快招工”,进行品牌升级后叫“快聘”,自推出后,已为比亚迪...
2025-06-27 18:04:36 1040浏览 0点赞 0回复 0收藏
导读:近日,快手发布并开源其最新自研的多模态大语言模型KwaiKeyeVL。KwaiKeyVL采用VisionEncoderProjectorLLM架构,集成了文本、图像、视频信息的混合输入处理能力,旨在为用户带来更智能、更全面的多模态交互体验。如果有人突然问你:「这张图片中有几颗草莓」?你会如何快速回复?面对五彩缤纷的果盘,我们往往需要反复端详,放大图片再逐一清点,耗费不少时间才能得到答案。然而,AI大模型正让这种复杂视觉识别变得简单—...
2025-06-27 15:39:52 2023浏览 0点赞 0回复 0收藏
导读:大模型技术正深刻重塑商业风控体系,推动风险管理向智能化、高效化、精准化转型。本系列专题首篇聚焦快手商业化风控内容审核场景,系统剖析大模型如何破解传统风控痛点,构建覆盖全链路的风险治理新范式。后续篇章还将进一步揭秘大模型评估标准Bechmark、智能体Agent、多模态推理模型等内容,敬请期待。一、引言快手商业化场景下,风险控制不仅关乎平台的信誉和经济效益,更直接影响用户和客户的体验和利益。理想的风控系...
2025-06-25 17:00:32 1563浏览 0点赞 0回复 0收藏
近日,快手推荐模型团队提出了一个端到端生成式推荐系统OneRec,该系统采用EncoderDecoder架构,引入了基于奖励机制的偏好对齐方法,借助强化学习增强模型效果,可在奖励模型引导下直接生成契合用户偏好的视频内容。通过极致的性能优化,OneRec在推荐模型FLOPs提升10倍的同时,大幅削减了通信和存储等运营成本近90%。目前,OneRec已在快手快手极速版双端承接25%的线上流量,带动APP停留时长分别提升0.54%和1.24%。当生成式架构...
2025-06-20 19:57:58 1.0w浏览 0点赞 0回复 0收藏
CVPR(IEEEConferenceonComputerVisionandPatternRecognition)是国际计算机视觉和模式识别领域的顶级学术会议之一。CVPR2025将于6月11日至6月15日在美国田纳西州纳什维尔举办,本届共收到了13,008篇有效论文提交,最终有2,878篇被接收,整体录用率约为22.1%。其中,快手共有12篇论文入选CVPR2025,涵盖视频质量评估、多模态数据集构建与基准测试、动态3D头像重建、动态4D场景模拟、视频生成与增强技术、可控视频生成与编辑等多...
2025-06-11 11:00:36 1700浏览 0点赞 0回复 0收藏
国际计算语言学年会(AnnualMeetingoftheAssociationforComputationalLinguistics,简称ACL)是由国际计算语言学协会(AssociationforComputationalLinguistics)主办的学术盛会,每年举办一次。作为计算语言学和自然语言处理领域最具影响力的会议之一,第63届ACL即将于7月27日至8月1日在奥地利首都维也纳隆重举办。近日,ACL正式公布了论文录用名单,快手基础大模型团队凭借其在人工智能领域的深厚积累,成功入选7篇论文。这些...
2025-06-05 20:34:36 1413浏览 0点赞 0回复 0收藏
导读:本文回顾了关于快手的核心数据对象“Photo”存储系统的一次巧妙降本增效的故事。通过充足细致的前期调研分析,以极少的人力投入取得了相当可观的收益。文中对有巨大UGC历史数据存量的平台型公司如何应对挑战有一些思考和总结。一、引言Prematureoptimizationistherootofallevil(oratleastmostofit)inprogramming.——DonaldKnuth快手作为国民级短视频平台,历史上短视频的总量已达千亿级,每日新增短视频作品超过4000万。...
2025-05-29 17:10:58 997浏览 0点赞 0回复 0收藏
​Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而,我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的。例如,在拍摄赛车追逐的场景时,镜头通常跟随赛车运动,并通过扣人心弦的超车时刻来展示赛事的白热化。而如今的视频生成模型无法实现3D场景中目标、相机联合控制的文本到视频创作,限制了AI影视制作的能力。近期...
2025-05-27 16:16:18 1089浏览 0点赞 0回复 0收藏
多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的reward,评估阶段可以选择更好的sample结果,甚至单独作为evaluator。尽管近期强化学习(RL)在传统视觉任务和多模态推理任务中取得了显著进展,但其在奖励建模中的应用仍然受到挑战,尤其是如何通过强化学习对奖励模型引入长期推理能力。快手、中科院、清华、南大的研究团队发现,直接把现有的RL算法(比如Reinfor...
2025-05-14 19:53:43 1444浏览 0点赞 0回复 0收藏
获得成就
已积累 1.6w 人气
获得 0 个点赞
获得 0 次收藏