大模型底座之向量化，以及向量化的原理

向量化是一切大模型技术的基础，大模型中的一切都是向量。在之前的文章曾不止一次的讲过向量，向量作为大模型的基础数据格式，其重要性不言而喻；但大部分人对向量还是没有一个深刻的认识。所以，今天我们就来讨论一个问题，那就是向量化，大模型的入口。‍‍‍‍向量化向量的概念这里就不解释了，有问题的可以看之前的文章，或者自己去找一下向量，矩阵的内容看看。先来讨论第一个问题，为什么要向量化？‍‍‍‍‍‍‍原因在于计

和老莫一起学AI

3399人浏览 · 2025-01-04 09:58:38

和老莫一起学AI · 2025-01-04 09:58:38 发布

“ 向量化是一切大模型技术的基础，大模型中的一切都是向量。”

在之前的文章曾不止一次的讲过向量，向量作为大模型的基础数据格式，其重要性不言而喻；但大部分人对向量还是没有一个深刻的认识。

所以，今天我们就来讨论一个问题，那就是向量化，大模型的入口。‍‍‍‍

向量化

向量的概念这里就不解释了，有问题的可以看之前的文章，或者自己去找一下向量，矩阵的内容看看。

先来讨论第一个问题，为什么要向量化？ ‍‍‍‍‍‍‍

原因在于计算机无法直接处理非数值性计算，所以的计算都需要转换成数值运算才行；但数值计算的方式有很多，为什么会选择向量作为载体？‍‍

原因就在于向量的几个基本特性：‍

第一就是向量便于计算机进行处理；
第二就是向量能够表示文本，图像等之间的语义关系
第三就是使用矩阵来表示向量，计算效率更高

什么是向量化？

简单来说向量化就是把其它格式的数据转换为向量形式，这里的其它格式包括我们常见的一切格式的数据，文本，图像，视频，音频等等；因此，可以直接把向量化理解为一种数据格式转换的技术。‍‍‍‍

在大模型中哪些地方需要进行向量化？‍‍‍‍‍‍

简单来说，任何需要输入到大模型的数据都需要向量化；其次，需要记录语义关系的也都需要向量化，比如RAG，向量数据库等。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

众所周知，大模型是由一个输入层，一个隐藏层，一个输出层组成；而其中隐藏层包括一个或多个神经网络层。其中，输入层需要做的一件事就是把输入数据向量化，只有这样才能被隐藏层接受和处理。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

记住一句话，在大模型中一切都是向量。

那怎么实现向量化？

在不同的技术阶段，向量化的方式也有所不同；以文本向量化来说，文本向量化一般有三种方式：‍‍‍

one-hot编码‍‍‍
词汇映射(Word2Vec)
Word Embedding(广义上Word2Vec也属于Word Embedding的一种)‍‍‍‍‍

词嵌入是文本向量化的一种常见方式，一般情况下会将一个单词映射到一个高维向量中来代表这个词，这就是词向量。

而文本嵌入层的作用就是，将文本中词汇的数字表示转变为高维的向量表示，旨在高维空间捕捉词汇间的关系。‍‍‍‍‍‍

Embedding 可以说是目前比较常见的一种向量化的方式，各大模型服务商，以及开源社区都发布了大量的Embedding模型来提供给用户使用；而Embedding嵌入就是一种经过专门训练的用来向量化数据的神经网络模型。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

只不过Embedding嵌入模型经过矩阵算法的优化，比传统的向量化方式效率更高，效果更好。

https://cloud.tencent.com/developer/article/1749306

而且，Embedding的应用非常广泛，其不仅是大模型的基础技术之一；事实上，Embedding也是大模型技术的应用场景之一。比如在图像搜索，推荐系统，广告，搜索等业务中，Embedding都发挥着重要的作用。

了解了文本向量化的工具之后，那么思考一下图像和视频是怎么实现向量化的？ ‍‍‍‍‍‍

在图像向量化的过程中，卷积神经网络和自编码器都是用于图像向量化的有效工具；前者通过训练提取图像特征并转换为向量；后者则学习图像的压缩编码以生成低维向量表示。‍‍‍‍‍‍‍

卷积神经网络（CNN）：通过训练卷积神经网络模型，我们可以从原始图像数据中提取特征，并将其表示为向量。例如，使用预训练的模型（如VGG16, ResNet）的特定层作为特征提取器。
自编码器（Autoencoders）：这是一种无监督的神经网络，用于学习输入数据的有效编码。在图像向量化中，自编码器可以学习从图像到低维向量的映射

零基础如何学习AI大模型

领取方式在文末

为什么要学习大模型？

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。

大模型典型应用场景

①AI+教育：智能教学助手和自动评分系统使个性化教育成为可能。通过AI分析学生的学习数据，提供量身定制的学习方案，提高学习效果。
②AI+医疗：智能诊断系统和个性化医疗方案让医疗服务更加精准高效。AI可以分析医学影像，辅助医生进行早期诊断，同时根据患者数据制定个性化治疗方案。
③AI+金融：智能投顾和风险管理系统帮助投资者做出更明智的决策，并实时监控金融市场，识别潜在风险。
④AI+制造：智能制造和自动化工厂提高了生产效率和质量。通过AI技术，工厂可以实现设备预测性维护，减少停机时间。
…
这些案例表明，学习大模型课程不仅能够提升个人技能，还能为企业带来实际效益，推动行业创新发展。

学习资料领取

如果你对大模型感兴趣，可以看看我整合并且整理成了一份AI大模型资料包，需要的小伙伴文末免费领取哦，无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述
请添加图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，皆可用。
在这里插入图片描述

在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有，跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述

四、LLM面试题

在这里插入图片描述

五、AI产品经理面试题

在这里插入图片描述

😝朋友们如果有需要的话，可以V扫描下方二维码联系领取~
在这里插入图片描述

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）]👈

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

揭秘易开发核心功能：页面信息提取与无障碍服务配置详解

易开发（DeveloperHelper）是一款专为Android开发者打造的快速开发工具，核心功能包括界面分析、页面信息提取、加固脱壳等，完美支持Android 9.0系统。本文将深入解析其两大核心功能——**页面信息提取**与**无障碍服务配置**，帮助开发者快速掌握使用技巧，提升开发效率。## 一、无障碍服务：易开发的核心引擎 🚀无障碍服务是易开发实现界面分析的基础，通过系统级别的

魔乐社区

CameraManager性能优化：提升iOS相机应用响应速度的10个技巧

CameraManager是一款简单易用的Swift类库，专为iOS开发者打造，提供了创建自定义相机视图所需的全部配置。在移动应用开发中，相机功能的响应速度直接影响用户体验，本文将分享10个实用技巧，帮助你优化CameraManager的性能，打造流畅的相机应用。### 1. 合理设置会话预设（Session Preset）会话预设直接影响相机的分辨率和性能消耗。在`Sources/Came

魔乐社区

如何用pyecharts-gallery制作交互式地图？AMap与BMap组件实战教程

pyecharts-gallery是一个基于pyecharts的开源项目，提供了丰富的Echarts官方示例模仿实现，帮助开发者快速掌握交互式数据可视化技能。本文将聚焦于如何利用该项目中的AMap和BMap组件，轻松创建专业级交互式地图应用。## 一、快速入门：项目准备与环境搭建要开始使用pyecharts-gallery制作交互式地图，首先需要获取项目源码。通过以下命令克隆仓库：``