备案 控制台
开发者社区 Java开发者 文章 正文

一文读懂“生成式 AI”

简介: 本文基于谷歌的:《Introduction to Generative AI》整理而成,帮助大家理解生成式 AI 这个概念

一、前言

本文基于谷歌的: 《Introduction to Generative AI》 整理而成,帮助大家理解生成式 AI 这个概念。
image.png
image.png
主要包括 4 个部分:

  • 生成式 AI 的定义
  • 生成式 AI 的工作原理
  • 生成式 AI 模型的类型
  • 生成式 AI 的应用

二、生成式 AI 介绍

2.1 生成式 AI 的定义

人工智能不等于机器学习

人工智能是关于赋予机器以模拟人类智能的能力的广泛领域。它涉及使计算机系统能够执行类似于人类智能的任务,如语音识别、图像识别、自然语言处理和决策制定等。
image.png

人工智能旨在使机器具备像人类一样的推理、学习、问题解决和决策能力
image.png

机器学习是人工智能的一个分支,它是通过数据和统计模型来让机器自动学习和改进的一种方法。机器学习的目标是设计和开发算法,使计算机系统能够从数据中学习,而无需明确地编程。通过训练模型,机器学习使机器能够识别模式、做出预测和进行决策

简而言之,人工智能是一个更广泛的概念,涵盖了使机器拥有人类智能的目标和技术。机器学习是实现人工智能的一种方法,通过让机器从数据中学习和自动调整模型来实现任务。因此,机器学习是人工智能的一个子集,但人工智能不仅限于机器学习,还包括其他方法和技术。

机器学习中的监督学习和无监督学习


监督学习和无监督学习是机器学习中两种不同的学习方法。
image.png
监督学习是一种通过使用带有标签的训练数据来训练模型的学习方法。在监督学习中,训练数据包含输入特征和对应的标签或输出结果。模型通过学习输入特征与标签之间的关系,从而能够对新的未标记数据进行预测。常见的监督学习算法包括线性回归、逻辑回归、决策树和支持向量机等。监督学习适用于需要进行分类、回归和预测等任务。

image.png
无监督学习是一种在没有标签的情况下从未标记的数据中自动发现模式和结构的学习方法。在无监督学习中,训练数据不包含标签信息,模型需要通过对数据进行聚类、降维或关联规则挖掘等技术来发现隐藏的结构和模式。无监督学习可以帮助我们理解数据的分布、发现异常点、进行数据可视化和特征提取等。常见的无监督学习算法包括聚类算法(如K均值聚类)、主成分分析(PCA)和关联规则挖掘等。

image.png

简而言之,监督学习使用有标签的训练数据来训练模型,并根据已知的输入和输出之间的关系进行预测。无监督学习则是在没有标签的情况下对未标记数据进行学习,通过发现数据中的模式和结构来获得洞察和理解。这两种学习方法在解决不同类型的问题和应用场景中发挥着重要的作用。

深度学习

深度学习是机器学习的分支。
image.png
机器学习是一种通过算法和模型让计算机系统从数据中学习的方法。它的目标是使机器能够自动从数据中发现模式、进行预测和做出决策,而无需明确地编程。机器学习算法可以根据给定的输入数据进行学习,并通过调整模型的参数来优化性能。常见的机器学习算法包括线性回归、决策树、支持向量机和随机森林等。
image.png

深度学习是机器学习的一个特定领域,它利用人工神经网络模型进行学习和训练。深度学习模型由多个层次(称为神经网络的层)组成,每一层都会对输入数据进行变换和表示。这些网络层通过一系列的非线性转换将输入数据映射到输出结果。深度学习模型的核心是深度神经网络(Deep Neural Network,DNN),它可以通过大量的标记数据进行训练,从而实现高度准确的预测和分类任务。
image.png

总的来说,机器学习是一种更通用的学习方法,可以使用各种算法和技术,而深度学习是机器学习的一个特定分支,使用深度神经网络来实现学习和预测。深度学习的主要优势在于它可以自动从原始数据中学习更高级别的特征表示,从而提供更准确和复杂的模型。然而,深度学习通常需要更大规模的数据和更高的计算资源来进行训练,相对于传统机器学习算法而言更为复杂。

生成式 AI 和深度学习的关系

image.png
生成式 AI 是深度学习的分支。

判别模型和生成模型

生成式模型主要包括判别模型(Discriminative Model)和生成模型(Generative Model)。
image.png判别模型(Discriminative Model)和生成模型(Generative Model)是机器学习中两种不同类型的模型,它们的主要区别在于其对数据的建模方式和应用领域。
image.png
判别模型是一种直接对条件概率进行建模的模型。它主要关注的是给定输入数据,预测输出类别或标签的概率分布。判别模型通过学习输入和输出之间的关系来建立决策边界,从而对新的输入数据进行分类。常见的判别模型包括逻辑回归、支持向量机和深度神经网络等。判别模型通常用于分类、回归和标注等任务。
image.png
生成模型是一种对联合概率分布进行建模的模型。它不仅学习输入和输出之间的关系,还学习了生成输入数据的过程。生成模型可以通过学习数据的分布和特征之间的关系来生成新的样本数据。常见的生成模型包括高斯混合模型(Gaussian Mixture Model,GMM)和生成对抗网络(Generative Adversarial Network,GAN)等。生成模型通常用于生成新的图像、语言模型和数据增强等任务。
image.png
判别模型和生成模型的选择取决于具体的问题和任务需求。判别模型更关注分类和预测的准确性,可以直接对输入和输出之间的关系进行建模。而生成模型更关注数据的生成过程,可以模拟数据的分布和生成新的样本。生成模型可以用于生成新的数据,但在分类和预测任务上可能不如判别模型准确。
image.png
总的来说,判别模型关注输入和输出之间的关系,用于分类和预测等任务。生成模型关注数据的生成过程,可以生成新的样本数据。选择判别模型还是生成模型应根据具体问题的需求和任务目标来决定。

生成式 AI 的监督、半监督和无监督学习

image.png
传统的监督、无监督学习,将训练数据和标注数据喂给模型,可以作出预测、分类和聚类。

image.png
生成式 AI 的监督、半监督、无监督学习,将训练数据、打标数据和未打标数据给基础模型,然后生成新的内容,最终实现文本、代码和图片的生成。

生成式 AI 和传统的编程和神经网络的区别

image.png
传统的编程方式,需要硬编码来描述猫的一些特征。
image.png
神经网络算法可以通过学习是不是猫的样本,然后你给出一张图片它可以判断是否为一个猫。
image.png
LaMDA 、PaLM、GPT 等生成式模型在喂了大量内容后,可以直接问猫是什么?它讲给出它所知道的答案。

生成式 AI 的定义

image.png
生成式 AI 是什么?

  • 生成式 AI 是人工智能的一个分支,可以根据已经学习的内容生成新的内容。
  • 从现有的内容中学习的过程叫做训练,训练的结果是创建一个统计模型。
  • 当用户给出提示词,生成式 AI 将会使用统计模型去预测答案,生成新的文本来回答问题。

生成式模型的分类

image.png

【生成式语言模型】是基于自然语言处理的技术,通过学习语言的规律和模式来生成新的文本。它可以根据之前的上下文和语义理解生成连贯的句子或段落。生成式语言模型的训练基于大规模的文本数据,例如新闻文章、小说或网页内容。通过学习文本中的单词、短语和句子之间的关系,生成式语言模型可以自动生成新的、具有逻辑和语法正确性的文本,如文章、对话和诗歌等。
【生成式图片模型】是基于计算机视觉的技术,通过学习图像的特征和结构来生成新的图像。它可以从之前的训练数据中学习到图像的特征表示和统计规律,然后使用这些知识生成新的图像。生成式图片模型的训练通常基于大规模的图像数据集,例如自然图像或艺术作品。通过学习图像的纹理、颜色、形状和物体之间的关系,生成式图片模型可以生成具有视觉真实感或艺术风格的新图像,如自然风景、人像或抽象艺术作品等。

image.png
生成式 AI 输入图片,输出可以是文本(看图说话、可视化问答、图片搜索)、图片(超分辨率,图片修改)和视频(动画)。

super resolution 是超分辨率的英文表达,它是指通过硬件或软件的方法提高原有图像的分辨率,通过一系列低分辨率的图像来得到一幅高分辨率的图像的过程。

image.png
生成式 AI 输入是文本,输出可以是文本(翻译、总结、问答、语法纠正)、图片(图片、视频)、音频(文本到发音)、决策(玩游戏)。

2.2 生成式 AI 的工作原理

image.png

生成式语言模型学习训练数据中的语言模式,然后给出一些文本,它们将会预测后面的内容是什么。
image.png

image.png

image.png

image.png

将用户的输入进入 Transformer 模型的编码器和解码器进行处理,然后在生成式预训练模型中进行处理,最终将结果输出给用户。

预训练:

  • 海量数据
  • 数十亿参数
  • 无监督学习

image.png
模型通过学习大量的文本数据,尝试预测下一个单词或短语。然而,有时候模型会生成一些不符合语法规则或意义不明的词语或短语,这被称为"幻觉(hallucinations)"。
image.png

幻觉可以视为模型在生成过程中的错误或缺陷,可能由于训练的数据量不够、模型的训练数据质量差、没有给模型足够的上下文、没有给模型足够的约束导致的。

image.png
提示词是作为大语言模型输入的一段文本,它可以以各种方式用来控制模型的输出。

image.png
提示词设计是创建提示的过程,从而从大型语言模型中生成期望的输出。正如我们之前提到的,生成 AI 在很大程度上取决于你输入的训练数据。它分析输入数据的模式和结构,生成内容。因此输入的质量决定了输出的质量。

2.3 生成式模型的类型

image.png
文本到文本生成模型旨在接收一个文本输入,并生成一个相关的文本输出。这种模型可用于机器翻译、文本摘要、对话生成、故事生成等任务。生成模型可以学习从输入到输出的映射关系,以生成具有语义和语法正确性的新文本。

常见应用场景:

  • 机器翻译:将一种语言的文本翻译成另一种语言。
  • 文本摘要:从长篇文本中生成简洁的摘要或概括。
  • 对话生成:生成自然流畅的对话,可用于虚拟助手或聊天机器人。
  • 故事生成:自动生成连贯、有趣的故事或叙述。

image.png
文本到图像生成模型接收一个文本描述作为输入,并生成对应的图像输出。这种模型可以将自然语言描述转化为视觉内容,用于图像生成、图像标注、图像编辑等任务。通过学习文本描述和图像之间的语义关联,模型可以生成与文本描述相匹配的图像。

常见应用场景:

  • 图像生成:根据文本描述生成与之相匹配的图像。
  • 图像标注:将图像描述转化为自然语言标注。
  • 图像编辑:通过文本指令实现图像编辑,如添加、修改或删除特定内容。

image.png
文本到视频或三维生成模型接收一个文本输入,并生成相应的视频或三维模型输出。这些模型可以用于视频生成、场景合成、三维模型生成等任务。模型可以学习从文本描述到视频序列或三维模型的转换过程,生成与文本描述相符的动态视频或立体模型。

常见应用场景:

  • 视频生成:根据文本描述生成与之相符的动态视频。
  • 场景合成:根据文本描述生成三维场景或虚拟现实体验。
  • 三维模型生成:根据文本描述生成具有特定属性或形状的三维模型。

image.png
文本到任务生成模型旨在根据文本输入执行特定任务。这些模型可以接收自然语言指令或问题,并生成相应的任务执行结果。例如,问答生成模型可以接收问题,并生成相应的答案;代码生成模型可以接收自然语言描述,并生成相应的代码实现。这种模型能够将文本指令转化为任务执行的具体操作。

常见应用场景:

  • 问答生成:根据问题生成相应的答案或解决方案。
  • 代码生成:将自然语言描述转化为代码实现。
  • 指令执行:根据自然语言指令执行特定的任务,如图像处理、数据操作等。

image.png

image.png
模型花园:Google Vertex AI 中有很多语言和视觉方面的基础模型可以选择。

image.png
Model Garden 是 Google 的一个开源项目,旨在为研究者和开发者提供预训练的机器学习模型和相关的训练和优化技术。这些模型覆盖了许多不同的机器学习任务,例如图像分类、物体检测和自然语言处理等。

Model Garden 中的模型分为两大类:语言模型和视觉模型。

  1. 语言模型:这类模型可以进行一些特定的语言处理任务,如:
    • 提取(Extraction):这类任务包括语法分析(Syntax Analysis),它可以理解文本的语法结构。
    • 分类(Classification):这类任务包括实体分析(Entity Analysis,识别文本中的特定实体,如人名、地名等)、内容分类(Content Classification,根据内容的主题进行分类)、情感分析(Sentiment Analysis,评估文本的情感倾向,如积极、消极等)、实体情感分析(Entity Sentiment Analysis,评估特定实体在文本中的情感倾向)。
  2. 视觉模型:这类模型可以进行一些特定的视觉任务,如:
    • 分类(Classification):这类任务包括对象检测(Object Detector,识别图片中的特定对象)。
    • 检测(Detection):这类任务包括人流量分析(Occupancy Analytics,分析特定区域内的人流量)、人/车辆检测(Person/Vehicle Detector,识别图片中的人或车辆)、个人防护设备检测(PPE Detector,识别图片中是否有人穿戴个人防护设备)、人物模糊(Person Blur,将图片中的人物进行模糊处理)。

这些模型都是为特定的任务进行训练和优化的,可以用来解决一些具体的实际问题。

2.4 生成式 AI 应用

image.png
生成式 AI 在文本(生成写作、AI 笔记、销售文案、聊天机器人、邮件编写等)、代码(代码生成、代码文档、文本转SQL、Web 应用构建等)、图片、发音、视频、3D 等领域都有大量的市场。

Bard 代码生成演示:
image.png

image.png
image.png

Bard 代码生成能力:
image.png

GenAI Studio 介绍:
image.png

生成式 AI App 构建器不需要任何编码就可以可以帮助你构建 AI 应用。
image.png

PaLM API 和 MakerSuite 可以简化生成式开发更容易。
image.png

image.png

明明如月
目录
相关文章
楠竹11
|
3天前
|
机器学习/深度学习 数据采集 人工智能
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰
【5月更文挑战第29天】生成式AI论文引发关注,提出无指数级数据增长或致其发展达顶峰。依赖大量数据的生成式AI可能已遇瓶颈,零样本学习能力受限。尽管有挑战,但研究建议关注数据质量、探索新算法及跨领域应用,同时应对环境、伦理问题。[论文链接](https://arxiv.org/pdf/2404.04125)
楠竹11
15 5
1808090903196729
|
2天前
|
人工智能 监控 搜索推荐
[AI Google] 如何通过 LearnLM 扩展生成式 AI 的好奇心和理解力
LearnLM 是 Google 新推出的一系列为学习而优化的模型,通过生成式 AI 增强教育体验,使学习变得更加有趣和个性化。
1808090903196729
7 0
[AI Google] 如何通过 LearnLM 扩展生成式 AI 的好奇心和理解力
MongoDB小助手
|
5天前
|
人工智能 NoSQL 安全
MongoDB 推出新项目,助力企业构建生成式 AI 现代应用程序
依托 MAAP,我们能够与合作伙伴共同助力客户利用生成式 AI 技术来提高生产率,颠覆客户交互方式,推动行业进步
MongoDB小助手
13 0
布客飞龙
|
15天前
|
机器学习/深度学习 人工智能 算法
Python 与 TensorFlow2 生成式 AI(一)(4)
Python 与 TensorFlow2 生成式 AI(一)
布客飞龙
45 0
布客飞龙
|
15天前
|
机器学习/深度学习 人工智能 TensorFlow
Python 与 TensorFlow2 生成式 AI(一)(3)
Python 与 TensorFlow2 生成式 AI(一)
布客飞龙
42 0
布客飞龙
|
15天前
|
机器学习/深度学习 人工智能 TensorFlow
Python 与 TensorFlow2 生成式 AI(一)(1)
Python 与 TensorFlow2 生成式 AI(一)
布客飞龙
12 0
布客飞龙
|
15天前
|
机器学习/深度学习 人工智能 算法
Python 与 TensorFlow2 生成式 AI(五)(3)
Python 与 TensorFlow2 生成式 AI(五)
布客飞龙
38 0
布客飞龙
|
15天前
|
机器学习/深度学习 人工智能 算法
Python 与 TensorFlow2 生成式 AI(五)(2)
Python 与 TensorFlow2 生成式 AI(五)
布客飞龙
33 0
布客飞龙
|
15天前
|
机器学习/深度学习 存储 人工智能
Python 与 TensorFlow2 生成式 AI(五)(1)
Python 与 TensorFlow2 生成式 AI(五)
布客飞龙
40 0
布客飞龙
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
Python 与 TensorFlow2 生成式 AI(四)(3)
Python 与 TensorFlow2 生成式 AI(四)
布客飞龙
47 4

Java开发者

热门文章

最新文章

  • 1
    AI学习笔记——神经网络和深度学习
  • 2
    资产管理大佬讲述:如何用大数据及人工智能挑选基金?
  • 3
    《人工智能:计算Agent基础》——3.8 本章小结
  • 4
    慧博科技「H-AI」智能助手引入阿里云AnalyticDB,开启商家智能数字化时代
  • 5
    Interview:人工智能岗位面试—人工智能职位之计算机视觉算法工程师的简介、知识结构、发展方向之详细攻略
  • 6
    AI 训练数据不够用?支付宝 3D 合成数据方案揭秘
  • 7
    苹果CEO库克:不要恐惧人工智能 技术既颠覆也创造
  • 8
    COMPUTEX展 CPX论坛聚焦AI与物联网
  • 9
    人工智能保卫网络安全:Waston开始被用于打击网络犯罪了
  • 10
    日媒:信息安全迈向自动化 AI助人类抵御黑客
  • 1
    科技云报道:第五次工业革命,中国AI企业如何打造新质生产力?
    67
  • 2
    破壁人AI百度:科技公司反内卷的典型样本
    24
  • 3
    微软AI程序员登场
    58
  • 4
    OpenAI与法国和西班牙媒体巨头合作:利用内容进行训练AI
    35
  • 5
    Katalist官网体验入口 生成式AI视觉故事板工具
    88
  • 6
    一个接口白嫖四个AI平台, 五个翻译平台
    109
  • 7
    ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
    47
  • 8
    F5怎么样?保障AI服务的安全性和交付
    32
  • 9
    【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
    131
  • 10
    Google Gemma 模型服务:开放的生成式 AI 模型服务
    122
  • 相关课程

    更多
  • AI开发者的Docker实践
  • AI社区开源学习实践
  • 趣味视觉AI应用入门与实战
  • AI数学基础
  • 相关电子书

    更多
  • 大数据AI一体化的解读
  • 当搜索遇见AI
  • 释放算力潜能,加速 AI 应用构建
  • 相关实验场景

    更多
  • 基于函数计算实现AI推理
  • 函数计算实战-云开发创建视觉AI应用
  • 自然语言入门:NLP数据读取与数据分析
  • 极速搭建基于人工智能的OCR识别应用
  • 部署Stable Diffusion玩转AI绘画(GPU云服务器)
  • 下一篇
    2024年阿里云免费云服务器及学生云服务器申请教程参考

    PHP网站源码泸州关键词排名包年推广公司安庆seo多少钱雅安关键词按天扣费吉祥网站设计报价镇江设计网站价格大丰百姓网标王推广推荐南平关键词按天计费价格新余网站搭建报价延边外贸网站设计哪家好汕尾网站搜索优化哪家好普洱网站搭建公司北海阿里店铺托管报价来宾网站推广方案推荐呼和浩特关键词按天计费报价铜陵百度关键词包年推广多少钱肇庆优化哪家好南澳网站建设设计推荐马鞍山seo网站推广公司衢州网站seo优化多少钱雅安网站改版玉林网站优化按天收费哪家好四平营销网站价格丽江seo网站推广长沙SEO按天扣费报价海南网站推广工具报价宿迁网络广告推广哪家好海东关键词排名包年推广报价濮阳网站排名优化哪家好自贡SEO按天收费公司永新外贸网站设计多少钱歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

    PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化