公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

周末程序猿

LV.2

鹅厂程序猿，专注后台开发和人工智能领域

帖子 15

声望 110

关注 0

粉丝 0

私信

关注

主帖 15

回帖

谈谈Vibe编程（氛围编程）

Vibe编程已经出现半年了，这半年也尝试了很多工具和构建了一些小的应用，这篇文章也谈谈我对于Vibe编程的理解。Vibe编程Vibe编程中文翻译是氛围编程，2025年2月3日，前OpenAI联合创始人、前特斯拉人工智能主管AndrejKarpathy在社交平台X上发布了一条看似平常却引发全网热议的推文，其大意是说：有一种新的编码方式，称之为Vibe编程；它让你完全沉浸在氛围中，拥抱指数级增长，甚至忘记代码的存在。Karpathy用一种近乎诗意的语言...

7天前 905浏览 0点赞 0回复 0收藏

技术总结 | 十分钟了解机器如何识别一只猫？

尽管多模态大模型已广泛应用于各个领域，但计算机到底是如何识别一只猫的？最近阅读了一篇文章（https:www.quantamagazine.orghowcanaiidacatanillustratedguide20250430），内容容易理解，总结如下。一个简单的分类器假设在同一个坐标系中存在三角形和方形，如下图：如果要将这两个类型分开，就需要一条分界线，但是如何知道这条分界线？传统的机器学习可以通过SVM，计算一条与刚好两个分类的各个点上距离和最小的一条...

7天前 397浏览 0点赞 0回复 0收藏

《Google Prompt Engineering》白皮书

精华

导言你不需要成为数据科学家或机器学习工程师每个人都可以编写提示。在考虑大型语言模型的输入和输出时，文本提示（有时伴随着其他模态，如图像提示）是模型用来预测特定输出的输入。你不需要成为数据科学家或机器学习工程师每个人都可以编写提示。然而，编写最有效的提示可能很复杂。提示的许多方面都会影响其效果：你使用的模型、模型的训练数据、模型配置、你的措辞、风格和语气、结构以及上下文都很重要。因此，提示工程是...

2025-07-25 07:59:36 1838浏览 0点赞 0回复 0收藏

ChatGPT | AI自制编程语言-从0开始

最近在看编译器的书籍，想从0开始写一个简单的自制编程语言练练手，但是同时想到自己现在手头有ChatGPT，于是萌生想法：如果我了解编译器整个设计过程，为什么我还需要重头开始写编译器呢？为何不直接将整个实现思路给到GPT，让GPT帮我实现代码，我只需要考虑如何设计词法和语法，如何优化等过程即可，说干就干，于是开始《ChatGPTAI自制编程语言》系列文章。1、试验在验证《AI自制编程语言》之前，我在想整个流程是否按照想法...

2025-06-20 06:58:57 962浏览 0点赞 0回复 0收藏

ChatGPT | AI自制编程语言-实现JavaScript编译器

随着当前各种编程Agent，MCP的层出不穷，大模型的正在加速进化，于是又开始探索，不过这次的目标是用golang实现JavaScript引擎（目标是完成ES5.1的全部功能）。1.回顾JS编译器的实现过程如上是总结的V8大体的实现方式，编程语言的实现已经经历了几十年的发展，包括V8，Lua等语言基本都采用类似实现步骤：词法分析语法分析语义解析和优化虚拟机通过JIT实现性能优化...2.如何选择...

2025-06-09 00:42:47 1121浏览 0点赞 0回复 0收藏

机器学习|深度学习卷积模型

在早期的图像分类中，通常流程是先人工提取特征，然后用对应的机器学习算法对特征进行分类，分类的准确率一般依赖特征选取的方法，甚至依赖经验主义。YannLeCun最早提出将卷积神经网络应用到图像识别领域的，其主要逻辑是使用卷积神经网络提取图像特征，并对图像所属类别进行预测，通过训练数据不断调整网络参数，最终形成一套能自动提取图像特征并对这些特征进行分类的网络，如图：图像处理1、卷积神经网络卷积神经网络（Convo...

2025-05-27 06:53:49 1273浏览 0点赞 0回复 0收藏

用 Windsurf 从0实现高性能JSON解析器

为了探索和改进AI工具在编程方面的体验，同时也想验证一些AI的边界，于是又想到了尝试从0实现高性能JSON解析器，说干就干。开始以为比较简单，不会超过半天就能实现，但是经过各种提示词优化，最终花了两天时间...1.选用工具现在有各种AICopilot，比较常用的Cursor，Windsurf，Trae等，不过我现在用的比较顺手的是：Windsurf。除了编程工具，然后就是模型，目前代码领域比较强的：Claude3.7Sonnet和Claude3.7SonnetThinkingGPT4...

2025-05-13 00:45:57 1462浏览 0点赞 0回复 0收藏

机器学习｜MCP（Model Context Protocol）实战

最近MCP这么火，了解了一段时间也该写篇总结，那就开始吧。1.什么是MCPMCP（ModelContextProtocol，模型上下文协议），2024年11月底，由Anthropic推出的一种开放标准，旨在统一大型语言模型（LLM）与外部数据源和工具之间的通信协议。官网的介绍：https:modelcontextprotocol.iointroductionMCP包括几个核心功能：Resources是允许服务器公开可由客户端读取并用作LLM交互上下文的数据和内容，包括文件内容，数据库，API，图片等...

2025-04-16 06:17:45 3671浏览 0点赞 0回复 0收藏

RAG实战 | 向量数据库LanceDB指南

1.LanceDB介绍LanceDB是一个开源的用Rust实现的向量数据库（https:github.comlancedblancedb），它的主要特点是：提供单机服务，可以直接嵌入到应用程序中支持多种向量索引算法，包括Flat、HNSW、IVF等。支持全文检索，包括BM25、TFIDF等。支持多种向量相似度算法，包括Cosine、L2等。与Arrow生态系统紧密集成，允许通过SIMD和GPU加速在共享内存中实现真正的零拷贝访问。2.LanceDB安装pipinstalllancedb预览版本：pipinstallpre...

2025-04-03 00:15:42 3133浏览 0点赞 0回复 0收藏

ChatGPT | Prompt中的CoT和ReAct

我们在写Prompt可能经常遇到不准确或者无法获得外部知识，因此本文讲述CoT和ReAct如何运作并提高大语言模型准确性。第一部分：CoT（思维链）1、什么是CoT通用的Prompt：问题：Roger有5个网球。他买了2罐网球。每罐有3个网球。他现在有多少个网球？答案：答案是11个。问题：自助餐厅有23个苹果。如果他们用了20个来做午餐，又买了6个，他们现在有多少个苹果？输出答案：答案是29个。CoT的Prompt：问题：Roger有5个网球。他买了2...

2025-03-24 00:22:42 2163浏览 0点赞 0回复 0收藏

机器学习|从0开发大模型之复现DeepSeek的aha moment

前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》，并且实现了一个简单版本的GRPO代码，不过从工程领域来看，并没有复现DeepSeekR1，于是最近申请了48G的显存，结合一些开源的方案复现ahamonent，并给出完整的代码和工具链。1、什么是ahamonentDeepSeekR1论文中提到，模型让作者「见证了强化学习的力量和美感」，在DeepSeekR1Zero的中间版本，「顿悟时刻」来了：模型学会了以人类的语气进行反思。ahamonent2、使...

2025-03-11 07:29:34 3132浏览 0点赞 0回复 0收藏

机器学习 | 从0开发大模型-译llama3-from-scratch

最近在看一篇github上大佬的文章，从0开始训练llama3，觉得对于《从0开发大模型》有点帮助，于是翻译一下，发现其中很多内容当前系列文章的知识点相似。原文：https:github.comnaklechallama3fromscratch其中metallamaMetaLlama38B文件地址：https:huggingface.cometallamaMetaLlama38Btreemainoriginal1、Tokenizer原始代码没有实现tokenizer，而是使用llama3的tokenizer.model，实现代码如下：执行：pipinstallblobfile执行：...

2025-02-19 12:48:53 2707浏览 0点赞 0回复 0收藏

机器学习 | 从0开发大模型之DeepSeek的GRPO

最近，DeepSeekR1的发布为国产大模型争光了（太强了），不过GRPO算法源自DeepSeekMath7B模型，该模型在MATH基准测试中取得了优异成绩，论文发表于2024年2月份：https:huggingface.copapers2402.03300，以下是该论文的摘要原文：Mathematicalreasoningposesasignificantchallengeforlanguagemodelsduetoitscomplexandstructurednature.Inthispaper,weintroduceDeepSeekMath7B,whichcontinuespretrainingDeepSeekCoderBasev1.57Bw...

2025-02-12 14:21:14 3307浏览 0点赞 0回复 0收藏

机器学习|从0开始大模型之模型DPO训练

1、为什么需要DPORafailov等人在2023年发表了一篇论文《DirectPreferenceOptimization:YourLanguageModelisSecretlyaRewardModel》，该论文提出了一种新的训练方法，称为直接偏好优化（DPO），该论文介绍：虽然大规模无监督语言模型(LM)可以学习广泛的世界知识和一些推理技能，但由于其训练完全无监督，因此很难精确控制其行为。现有的获得这种可控性的方法是收集模型生成相对质量的人类标签，并微调无监督语言模型以符合这些偏...

2025-02-04 20:36:48 3104浏览 0点赞 0回复 0收藏

机器学习|从0开始大模型之位置编码

1、什么是位置编码在语言中，一句话是由词组成的，词与词之间是有顺序的，如果顺序乱了或者重排，其实整个句子的意思就变了，所以词与词之间是有顺序的。在循环神经网络中，序列与序列之间也是有顺序的，所以循环神经网络中，序列与序列之间也是有顺序的，不需要处理这种问题。但是在Transformer中，每个词是独立的，所以需要将词的位置信息添加到模型中，让模型维护顺序关系。位置编码位置编码就是将helloworld!的token和位置...

2025-01-20 12:07:07 2794浏览 0点赞 0回复 0收藏

获得成就

已积累 6975 人气

获得 0 个点赞

获得 0 次收藏