lintoms
LV.1
这个用户很懒,还没有个人简介
声望 37
关注 0
粉丝 0
私信
主帖 6
回帖
随着AIAgents技术的不断发展和成熟,我们可以期待在未来看到更多令人兴奋的创新和应用。这些技术有望成为推动人类进步和提高生活质量的重要工具。本周,一家名为CognitionAI的初创公司引起了轰动,他们发布了一个演示,展示了一个名为Devin的人工智能程序执行通常由高薪软件工程师完成的工作。像ChatGPT和Gemini这样的聊天机器人可以生成代码,但Devin更进一步,规划解决问题的方法,编写代码,然后测试和实施。Devin的创建者将...
1天前 83浏览 0点赞 0回复 0收藏
​“想象一下,有一天我们能够打造出一个在厨房里执行各种任务的家庭机器人。那么问题就不仅仅是感知了。你真的需要学会各种个人操纵技能,以便能够广泛地泛化。”——Sergey​Craig:嗨,我是CraigSmith,欢迎收听《AI视界》。今天我和SergeyLevine进行了交谈,他是加州大学伯克利分校的副教授,在该校的机器人人工智能与学习实验室从事研究,并推动着AI控制机器人的边界。Sergey谈到了他最近在强化学习和从世界各地的机器人中...
5天前 136浏览 0点赞 0回复 0收藏
Sora是OpenAI发布的一款视频生成模型,采用了DiffusionTransformer架构,旨在实现高保真度和视频图像的前后一致性。其突出之处在于能够生成逼真流畅的视频内容,令人惊叹不已。Sora一经推出便在极短的时间内迅速引起了科技界和社会各界的关注,同时也引发了关于AI技术发展和产业变革的激烈讨论,日前,MoPaaS魔泊云创始人和CEO鲁为民博士参与腾讯科技举办的:与硅谷专家和创业者共同探讨:Sora的商业逻辑与技术创新分析直播活动...
2024-04-28 15:48:31 234浏览 0点赞 0回复 0收藏
OpenAI的Sora又一次出圈,掩盖其它新的AI产品的锋芒,包括几乎同期发布的Google的Gemini1.5和Meta的VJEPA。很多AI从业者为此大抱不平,声称“被Sora夺走风头的Gemini被低估了!”特别是Google这次推出的Gemini1.5Pro是一种多模态大模型(涉及文本、视频、音频),性能水平与谷歌迄今为止最大的模型1.0Ultra类似,并引入了长上下文理解方面的突破性实验特征。它能够稳定处理高达100万Tokens(相当于1小时的视频和超过3万行代码)...
2024-04-23 11:30:31 260浏览 0点赞 0回复 0收藏
鉴于我们在Reka成功地培训了相当强大的多模态语言模型,许多人对从零开始建立基础设施并训练大型语言和多模态模型的经验特别感兴趣。我在社交媒体上经常抱怨外部(Google之外)的基础设施和代码,这让人们对我在荒野中错过了什么,以及我对什么讨厌喜欢非常好奇。所以终于有了这篇文章。这篇博客文章揭示了挑战和经验教训。我希望这篇文章对许多人来说既有趣又有教育意义。在荒野中训练LLMs(图片由DallE生成)在LLMs时代的硬件...
2024-04-15 13:00:26 237浏览 0点赞 0回复 0收藏
上个月,当OpenAI公布其新的生成式视频模型Sora时,邀请了一些电影制作人来试用。本周,该公司发布了结果:七部超现实的短片,毫无疑问地表明了生成式视频的未来即将迅速到来。首批能将文本转化为视频的模型出现在2022年末,来自Meta、谷歌和视频技术初创公司Runway等公司。这是一个很棒的技巧,但结果是颗粒状、出现故障,并且只有几秒钟长。快进18个月,Sora的高清、逼真的最佳输出令人震撼,一些激动的观察者甚至预言好莱坞...
2024-04-12 15:35:08 278浏览 0点赞 0回复 0收藏
获得成就
已积累 315 人气
获得 0 个点赞
获得 0 次收藏