transformer

SMA2:代码实现详解——Image Encoder篇（FpnNeck章）

在计算机视觉领域，图像编码器是实现目标检测、图像分割等任务的关键部分。SMA2（Smooth Mixed Attention）的设计意在提高模型对图像特征的提取效率，并通过特定的网络结构优化特征融合。FPN（Feature Pyramid Network）是当前图像编码器中常用的一种特征金字塔网络结

后端 2024年10月21日 0 点赞 0 评论 20 浏览

本地部署 Llama 3.1：Ollama、OpenWeb UI 和 Spring AI 的综合指南

本地部署 Llama 3.1：Ollama、OpenWeb UI 和 Spring AI 的综合指南介绍随着人工智能的快速发展，各种大型语言模型（LLM）如 Llama 3.1 的出现，使得开发者能够在本地环境中构建强大的应用。本文将详细介绍如何本地部署 Llama 3.1，并使用 Ollama

前端 2024年10月18日 0 点赞 0 评论 24 浏览

详解各种LLM系列｜（4）GLM（GPT国内最强开源平替）模型架构、预训练技术详解

GLM（General Language Model）详解随着大语言模型（LLM）的发展，涌现出许多优秀的开源项目，其中GLM（General Language Model）被广泛认为是国内性能最强的开源平替之一。GLM在一般性语言理解和生成任务中表现出色，且由于其开源特性，得到了广泛的应用和研究

后端 2024年10月12日 0 点赞 0 评论 34 浏览

前端大模型入门：使用Transformers.js实现纯网页版RAG（一）

前端大模型入门：使用Transformers.js实现纯网页版RAG（检索增强生成）（一）在当今的人工智能领域，检索增强生成（Retrieval-Augmented Generation，RAG）模型因其在信息检索和文本生成方面的强大能力受到了广泛关注。RAG模型结合了传统信息检索技术与现代的生成

前端 2024年10月10日 0 点赞 0 评论 20 浏览

学习笔记：基于Transformer的时间序列预测模型

基于Transformer的时间序列预测模型一、引言时间序列预测是许多领域中重要的任务，如金融市场、气象预测、库存管理等。传统的预测方法如自回归模型（AR）、移动平均模型（MA）等在面对非线性和复杂模式时，往往表现不足。近年来，深度学习技术的发展，尤其是Transformer模型的提出，为时间序

后端 2024年10月06日 0 点赞 0 评论 26 浏览

新架构Mamba-2正式发布！！真实版“man, what can i say”！！

新架构Mamba-2正式发布，给开发者们带来了更高效、更灵活的程序开发体验。在现代软件开发中，架构的选择与设计直接影响了项目的可维护性、性能及扩展性。Mamba-2架构在此背景下应运而生，旨在通过模块化和可重用的设计理念，为开发者提供一套现代化的工具和框架。Mamba-2的设计理念Mamba-2

后端 2024年09月30日 0 点赞 0 评论 25 浏览

Transformer 论文通俗解读：FFN 的作用

在深入理解Transformer架构时，前馈神经网络（Feed Forward Neural Network, FFN）是一个非常重要但常常被忽略的组成部分。Transformer 在自然语言处理和其他领域取得了巨大的成功，而 FFN 则是它能够高效处理信息的关键之一。本文将通俗解读 FFN 的作用

后端 2024年09月30日 0 点赞 0 评论 94 浏览

Linux快速部署大语言模型LLaMa3，Web可视化j交互（Ollama+Open Web UI）

在最近的自然语言处理领域，LLaMa 3（Large Language Model Meta AI）作为一种强大的大语言模型，受到越来越多的关注。随着模型的不断迭代，如何高效地部署和可视化其交互界面成为了开发者和研究者的重要课题。本文将介绍如何在Linux系统上快速部署LLaMa 3，同时利用Oll

前端 2024年09月26日 0 点赞 0 评论 31 浏览

transformer

首页

transformer

列表

默认

浏览次数

发布日期