码农随心笔记
LV.1
关注AGI、嵌入式软硬件开发,每天收获一点点
声望 80
关注 0
粉丝 0
私信
主帖 10
回帖
输出层(OutputLayer)是Transformer框架的最后一部分,负责生成最终的输出序列。它是Transformer框架中连接“模型理解”与“实际应用”的桥梁,决定了模型是否能够适配具体任务并产出有意义的结果。因此它在整个模型中起着至关重要的作用。下面我们一起来详细了解输出层的关键作用和工作原理。一、如何理解输出层1.输出层作用:Transformer架构的输出层是整个模型中将编码得到的语义信息转化为目标任务结果的部分。它的目的是...
4天前 628浏览 0点赞 0回复 0收藏
1.感触从2018年开始我就一直从事机器人研发工作,自从2022年11月CharGpt诞生以来,我一直动态关注,用了CharGpt3.0之后,确实给到我很多惊喜,它比以前我们用的机器人知识库平台有了质的飞跃。2.机器人知识库1.0时代旧有的机器人知识库平台是这样玩的,当人与机器人对话时,机器人用麦克风采集人的声音,把录音后的音频文件传送到知识库后台,后台靠语音识别技术形成文字,再用文字与数据库中的语句做对比,数据库检索到匹配度...
2025-07-08 07:13:21 487浏览 0点赞 0回复 0收藏
PyTorch在深度学习领域中,无疑是一个巨人般的存在,它是一个开源的框架,用于构建和训练神经网络模型。它的目标是提供一个易于使用的、高性能的、灵活的框架,可以让开发者快速地构建和训练模型。近期火爆的Llama3.1,Llama3.2大模型就是基于PyTorch框架训练而成的。本篇就以通俗易懂的方式为各位同学介绍一下为什么要用PyTorch,它能给我们带来哪些便利。1.PyTorch的作用假如你想让电脑识别猫咪。你手里有一堆猫的照片和一些不...
2025-07-08 07:03:15 658浏览 0点赞 0回复 0收藏
Dify是一款功能强大、易于使用的开源AI平台,它为开发者提供了一个构建、部署和管理AI应用的便捷方式。凭借其可视化界面、多模型支持和可扩展性,Dify正在成为越来越多开发者和企业的首选,本篇我们一起来看看如何快捷方便地搭建Dify+Ollama本地聊天机器人。一、安装部署Dify有两种安装方式,一种是DockerCompose部署,另一种是本地源码编译后再安装,为了方便快捷,本次选择在Ubuntu下用DockerCompose部署,Dify也支持Windows...
2025-06-24 06:49:04 1318浏览 0点赞 0回复 0收藏
一、配置与安装我在尝试运行AlpacaLoRA工具给大模型做微调时,发现了准备篇中的一些方法存在问题。经过了反复摸索,有以下几点需要重新配置一下。1.由于https:huggingface.co国内无法访问,需要预先从镜像站:https:hfmirror.com下载好模型文件,而且需要重新选择baffo32decapodaresearchllama7Bhf模型进行微调,因为这是AlpacaLoRA工具的推荐模型,为了提高成功率,本次先选它。2.我们准备用huggingfacehub工具下载模型,先激...
2025-06-11 06:50:30 1198浏览 0点赞 0回复 0收藏
当我们想构建高性能的机器学习和AI系统时,仅仅训练单个模型和系统往往是不够的。通常在开发中需要构建多个模型,使用多种不同的算法,然后将不同的模型相互比较,看看哪个模型最好。此外,在比较过程中还需要“调整”每种不同算法的设置,以使它们以最佳方式(或接近最佳)执行。所以大多数机器学习算法都有“设置”,我们可以称之为超参数,使用超参数是机器学习的重要组成部分。一、什么是超参数在机器学习和人工智能中,超...
2025-06-11 06:47:18 1502浏览 0点赞 0回复 0收藏
在当下流行的各种大模型工具中,LlamaFactory是全球开发者常用的一套工具集,它基于Transformer架构,为我们提供了一套简单、快速而又高效的大模型定制化训练与部署工具,并且它提供了模块化、可扩展和流程化的框架,支持多种主流的大语言模型(如LLaMA、ChatGLM、Qwen等),一站式地集成了数据预处理、训练、微调、评估和推理等多种功能。本篇我们一起来看看LlamaFactory能为我们带来哪些便利。一、核心功能1.多模型支持兼容主...
2025-05-29 06:31:45 1884浏览 0点赞 0回复 0收藏
机器人流程自动化(RoboticProcessAutomation,简称RPA)是一种通过软件机器人来自动化地执行重复性、规则性强、耗时的任务的技术。它模仿人类用户在应用程序界面上的交互行为,如点击鼠标、输入数据、复制粘贴等,从而实现业务流程的自动化处理。那应该如何去理解这项技术呢?下面我们来一窥究竟。一、RPA的特点1.非侵入性:RPA不需要对现有的IT系统、软件或应用程序进行修改或集成。它直接在应用的用户界面层(UI层)进行操作...
2025-05-15 06:40:06 1384浏览 0点赞 0回复 0收藏
在当下流行的几种大模型微调方法中,大家经常会看到谈论SFP与Unsloth的文章,那我们应该如何了解它们?它们的技术特点又有哪些?各自应用在哪些模型微调的场景呢?本篇我们带着这些问题,一起来了解一下。一、SFT微调技术介绍监督微调(SupervisedFinetuning,SFT)是一种迁移学习(TransferLearning)技术,指的是在已经预训练好的模型(例如大语言模型中的GPT、BERT等)基础上,使用带有人工标注标签的监督数据,对模型进行进...
2025-04-29 00:25:24 2323浏览 0点赞 0回复 0收藏
在机器学习领域中,ChainofThought(思维链)技术是一种在大语言模型(LLM)推理任务中非常重要的方法,它诞生的目的是使模型能够像人类一样,通过一系列中间推理步骤来得出最终答案,而不是简单地给出一个直接的答案。这种能力对于提升模型的解释性、可信度和解决复杂问题的能力至关重要,尤其是在涉及逻辑推理、数学计算、问答等需要多步推理的应用场景中。本篇我们一起来了解一下CoT技术。一、什么是思维链技术1.基本概念思...
2025-04-29 00:22:24 2800浏览 0点赞 0回复 0收藏
获得成就
已积累 3035 人气
获得 0 个点赞
获得 0 次收藏