Page 1 of 1

深度学习当前应用领域

Posted: Wed Jan 29, 2025 4:54 am
by suchona.kani.z
深度学习现已应用于各个领域,以创造新的机会或改进现有的解决方案。一些例子是

计算机视觉,使得处理和理解视觉信息成为可能。
自然语言处理
生成式人工智能——复杂的信息生成算法
生成式人工智能(GenAI)是人工智能的另一个子集,它负责开发能够生成与所学内容类似的新数据或内容的模型。 GenAI 是人工智能第三次浪潮背后的驱动力,第三次浪潮将于 2020 年代开始,主要基于所谓 Transformer 模型的开发。

变形金刚来了
Transformer 架构是 2017 年论文《Attention is all you need》中介绍的一种新型人工神经网络。 Transformer 架构基于注意力的概念,它允许识别输入中最相关的部分并对其进行加权以产生输出。 Transformer 架构由两个主要 商家现金预付电子邮件营销 组件组成:编码器和解码器。编码器将输入转换为一系列包含输入的语义和句法信息的向量。解码器通过关注到目前为止产生的输入和输出,从编码器的向量产生输出。


向量 - 作为数学排序的辅助工具
所有机器和深度学习方法的共同点是模型最终都会执行数学运算。由于这些操作基于数字,因此任何非结构化信息(例如文本、图像或声音)都必须首先转换为数字。每个信息单元,例如单词、像素或幅度,都被分配一个包含该单元属性的向量。使用向量允许在公共(数学)空间中表示信息,其中信息之间的相似性或关系可以通过向量之间的距离或角度来测量。


使用向量不仅可以表示文本信息,还可以表示其他类型的信息,例如音频、图像甚至蛋白质。这为 GenAI 生成或处理不基于自然语言的各种类型的信息提供了新的机会。一些例子是

Jukebox:一种能够通过预先学习大量音乐语料库然后将其应用于各种任务(例如音乐风格、音乐歌词或音乐创作)来生成音乐的模型。
CLIP(对比语言-图像预训练):一种能够通过预学习大型图像-文本语料库来理解图像的模型,然后应用于图像分类、图像搜索或图像标记等各种任务。
AlphaFold:一种能够通过预先学习大型蛋白质语料库,然后将其应用于蛋白质设计、蛋白质相互作用或蛋白质功能等各种任务来预测蛋白质三维结构的模型。
多式联运模型 - 全能型
多模态模型是能够同时生成或处理多种类型信息的 GenAI 模型,例如文本和图像、文本和声音或图像和声音。这需要模型具有高度的复杂性和集成性,因为它们必须能够组合和协调不同的信息以产生连贯且有意义的输出。