从2024年12月份DeepSeek发布了DeepSeekV3开始,整个AI圈内就掀起了一波技术创新式浪潮,核心的因素在于一家在2023年刚注册成立的初创企业所发布的第一个正式版本模型就直接对标了OpenAI闭源的GPT4o以及Claude3.5Sonnet,更重要的是其训练阶段的成本只有不到600万美元,是什么概念?在这之前,普遍的训练成本都在千万甚至于上亿美元的成本支出,突然出现预训练大模型在性能上比肩目前最强的GPT4o,成本上比GPT4o要节约十几倍,关...
2025-05-29 06:12:20 465浏览 0点赞 0回复 0收藏
本来想写在AI大模型中对于数据方面的挑战,但是发现还是要找一个场景来铺垫一下,正好去年做过一些大模型知识库的内容,对于RAG方面还算了解一些,所以先来说一下关于大模型应用方面的东西吧,下一篇再来聊聊AI大模型场景中对于数据管理方面的机会。先解释一下什么是检索增强生成技术(下文简称:RAG),对于日常我们所理解的大模型来说,他们具备的是模型本身能力(亿级别参数+通用数据),但是在特定领域内的数据可能是无法获...
2025-05-15 00:25:29 1009浏览 0点赞 0回复 0收藏
在数据应用场景中,数据源属于数据管理是非常的一个环节,包括数据源、数据集成、生命周期、数据地图、数据标注、数据安全、主数据等等等,数据管理也是整个数据治理体系中最核心的部分之一,面向智算领域的数据能力,对于AI数据治理会有一些新的挑战。在过去数十年的大数据领域发展过程中,结构化数据和半结构化数据处理都是其中绝对的主角,结构化和半结构化数据由业务流程产生,与商业价值高度相关,这些数据与企业的流程业...
2025-04-28 23:52:39 1242浏览 0点赞 0回复 0收藏
最近一直在做数据+AI方向的工作,前两天无意中看到一个MCP的技术,经过详细的学习之后,了解到这个可能不仅仅应用在大模型,而更多是数据和模型之间的桥梁,最近就一直在考虑对于多模态数据如何才能实打实的和应用模型结合起来的事情,MCP无疑是提供了某种思路,下面是关于MCP的一些介绍,部分内容是参考的社区文档。MCP(ModelContextProtocol)是一种开放协议,它标准化了应用向设备提供上下文的方式。可以将MCP想象成AI应用...
2025-04-18 06:53:54 946浏览 0点赞 0回复 0收藏