知乎 - AI 大模型课

3. AI Programming

Check

👉主题:从 AI 编程认知 AI
👨🏼‍🏫老师:林老师

大纲:
✅1. 什么是AI编程

  1. AI编程的成功案例
  2. AI编程的场景
  3. AI编程的定义
    ✅2. AI编程的原理和实现——GitHub Copilot
  4. 商业成功
  5. 补全代码的技巧和原理
  6. 产品设计理念
  7. 工具介绍
    ✅3. 最佳工具 Copilot介绍
  8. Copilot Coding
  9. Copilot Chat
  10. Copilot Command
  11. 其他使用技巧
    ✅4. 如何理解AI编程
  12. 结对编程
  13. AI能力定律和提效定律
    ✅5. Copilot 的平替们
  14. 国产开源 CodeGeeX
  15. 可本机部署的 Tabby
  16. Bito、Amazon CodeWhisperer、Cursor、Tabine、Tongyi Lingma
  17. 更多开源编程大模型
  18. Code Llama
  19. 姜子牙 Ziya-Coding-15B-v1
  20. CodeFuse-CodeLlama-34B
  21. WizardCoder
    ✅6. 编程 Agents
  22. GPT Engineer
  23. GPT Web App Generator
  24. MetaGPT
  25. Agent 的落地难题
    ✅7. 企业如何推动AI编程
  26. 企业内部推动
  27. 企业对外服务
  28. 使用AI编程需要注意的内容
  29. 如何测量AI编程提效

4. Function Calling

Check

👉主题:Function Calling
👨🏼‍🏫老师:孙志岗老师

大纲:
✅1. 看 AI 巨变带来的 UI、API 终极演变
✅2. NLI 塑造未来软件世界
✅3. 大模型连接真实世界的方法

  1. 用 GPTs Actions 对接高德地图
  2. 原理解析
  3. GPTs 的平替:Coze、Dify
    ✅4. 用 Function Calling 做更灵活的对接
  4. 机制原理
  5. 调用本地函数
  6. 多 Function 轮流调用和同时调用
  7. 用 Function Calling 构造 JSON
  8. 从自然语言生成 SQL 语句
  9. 流式调用
    ✅5. Function Calling 注意事项
    ✅6. 支持 Function Callling 的国产大模型
    ✅7. Function Calling 带来的产品想象空间

6. Assistant API

Check

👉主题:Assistants API
👨🏼‍🏫老师:王卓然老师

大纲:
✅1. GPTs & Assistants API 简介
✅2. 如何在 GPT Store 创建/发布自己的 GPT
✅3. Assistants API 的主要能力
✅4. 基于 Assistants API 开发

  1. 创建 assistant
  2. 管理 thread
  3. 添加 message
  4. 开始 run
  5. 中控调度
    ✅5. 在 Assistant 中调用工具
  6. Function Calling
  7. Code Interpreter
  8. RAG
    ✅6. 用 Assistants API 实现多角色隔离与协作
    ✅7. 原生 OpenAI API、GPTs、Assistants API、国产/开源大模型选型参考
  • ! 这节课主要讲了GPTs和背后的Assistant API
  • 讨论了使用场景
  • 展示了如何用 Assistant API 实现一个GPTs
  • GPTs和Assistant API降低了开发模板
    • GPTs 教育客户
    • 更大自由度使用Assistant API
  • Assistant API 提供了一个对话服务
  • 想要获得更好的效果,还是需要 微调 LLM + RAG

Demo: Assistant API + File API 实现 PDF总结:

import os 
from openai import OpenAI

client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))

# show all uploaded files
uploaded_files = client.files.list()
print(uploaded_files)

# retrive file by file name
target_file_name = "地卫2-卫星遥感应用白皮书.pdf"

target_file_id = None

file_objects = list(filter(lambda x: x.filename == target_file_name, uploaded_files.data))

if len(file_objects) > 0:
  target_file_id = file_objects[0].id

# upload file to openai
file = client.files.create(
    file = open("../dataset/地卫2-卫星遥感应用白皮书.pdf", "rb"),
    purpose='assistants'
)

# check uploaded file status
retrieved_file = client.files.retrieve(file.id)
if retrieved_file:
  print(f"File {retrieved_file.filename} upload successfully!")
else:
  print("File retrieval failed!")

7. Semantic Kernel

Check

👉主题:Semantic Kernel
👨🏼‍🏫老师:王卓然老师

大纲:
✅1. Semantic Kernel 架构

  1. 最新进展
  2. 写个 Hello World
    ✅2. Plugins
  3. SemanticFunctions
  4. Semantic Kernel Tools
  5. Native Functions
  6. SKContext
  7. 内置 Plugins
    ✅3. Memory 和向量检索
    ✅4. Planner
    ✅5. VS Code 插件,不用代码即可调试 Semantic Function
  • @ Semantic Kernel 是一个微软开发的LLM开发框架
    • Semantic Kernel 是微软研发的一个开源的,面向大模型的开发框架(SDK);
    • 它支持你用不同开发语言(C#/Python/Java)基于 OpenAI API/Azure OpenAI API/Huggingface 开发大模型应用;
    • 它封装了一系列开箱即用的工具,包括:提示词模板、链式调用、规划能力等。

讲座:数字分身应用及技术介绍

Check

今天是讲座课,非常有幸邀请来MyTwins.ai 创始人&CEO,曾任淘宝直播技术总负责人吴桂林(梁舒)老师 。

👉主题:数字分身应用及技术介绍
👨🏼‍🏫老师:吴桂林(梁舒)老师
🕙时间:今晚8点

大纲:
✅数字分身介绍及应用

  1. 数字分身介绍
  2. 数字分身的应用场景
    ✅数字分身声音建模
    ✅数字分身大脑建模
    ✅数字分身形象建模
    1.2D 数字形象及技术体系
    2.3D 数字人形象及技术体系
    3.2D 数字人目前算法技术方向
    4.2D 新的一些技术:EMO
    ✅数字分身未来技术讨论

8. Langchain

Check

👉主题:LangChain
👨🏼‍🏫老师:王卓然老师

大纲:
✅1. 模型I/O封装
a.模型的封装
b.模型的输入输出
c.PromptTemplate
d.OutputParser
✅2. 数据连接封装
a.文档加载器:Document Loaders
b.文档处理器
c.内置RAG: RetrievalQA
✅3. 记忆封装:Memory
✅4. 链架构: Chain/LCEL
✅5. 大模型时代的软件架构:Agent
a.ReAct
b.SelfAskWithSearch
c.Assistants API
✅6. LangServe
✅7. LangChain.js

9. LLM应用开发工具链

Check

👉主题:LLM应用开发工具链
👨🏼‍🏫老师:王卓然老师

大纲:
✅1.如何维护一个生产级的LLM应用
✅2.LangFuse 平台
a.平台注册与链接
b.AGI课堂跟课助手监控后台演示
c.记录与追踪LLM的调用记录
d.构建回归测试集
e.Prompt 调优与回归测试
f.Prompt 版本管理
g.更多评测标准简介
✅3.LangSmith 平台
a.基本功能
i.LLM调用记录
ii.Playground
b.数据集管理
c.回归测试
✅4.Prompt Flow
a.VSCode 插件
b.与SK结合使用

10. 手撕 Agent 实现 AutoGPT

Check

👉主题:手撕 Agent 实现 AutoGPT
👨🏼‍🏫老师:王卓然老师

大纲:
✅1. Agent 简介
✅2. Agent 的主流程图
✅3. 设计 ReAct 的 Prompt 模板
✅4. 设计长时和短时 Memory
✅5. 实现主流程
✅6. 设计鲁棒的纠偏策略,防止死循环
✅7. 封装自己的 Tools
✅8. 运行自己的 AutoGPT 助手!

11. 模型微调(上)

Check

👉主题:模型微调(上)
👨🏼‍🏫老师:王卓然老师

大纲:
✅1. 小实验1:动手微调一个小 GPT
a. HuggingFace简介
b. 模型加载
c. 数据加载
d. 训练器
✅2. 什么是模型
✅3. 什么是模型训练
a. 训练时几个重要超参
b. 调整超参,再跑实验1
✅4. 求解器 & 损失函数简介
✅5. 小实验2:手写一个简单的神经网络并训练它

12. 模型微调(下)

Check

👉主题:模型微调(下)
👨🏼‍🏫老师:王卓然老师

⚠️注意:此前实验室环境中课程的实验代码,fine-tuning-lab.zip,与王老师 今晚(3月28日)教学使用的版本不一致。发现有同学已经提前下载了代码进行实验,建议重新下载最新代码,以便与课上讲解对齐。

大纲:
✅1. 什么是训练/预训练/微调/轻量化微调
✅2. Transformer结构简介
✅3. 轻量化微调
a.Prompt Tuning
b. P-Tuning
c. Prefix Tuning
d. LoRA
e. QLoRA
f. AdaLoRA
✅4. 实验数据集的构建
✅5. 实战 1:基于 Prefix-Tuning 微调 ChatGLM3-6B
✅6. 实战 2:基于 LoRA 微调 ChatGLM3-6B
✅7. 实战 3:基于 QLoRA 微调 Llama2-7B
✅8. 更多训练数据的构建技巧

加课 : LangChain核心代码解读

Check

今天赠送大家一节加餐课——LangChain 核心源码解读 :关于LLM和Agent

这是 AI 全栈四期学员薛宏伟基于主干课内容,对 LangChain 进行潜心研究的总结。他是一名资深程序员,拥有十五年的软件开发经验,与大家一同从零开始学习AI和LangChain。他对LangChain项目非常推崇,并且深入研究LangChain的源代码结构,热切希望能够与大家分享他的发现。

👉主题:LangChain 核心源码解读 :关于LLM和Agent
👨🏼‍🏫老师:薛宏伟
🕙时间:今晚8点

大纲:
✅解读源码,集成自己的大模型到 LangChain

  1. 大模型的一般用法回顾
  2. 简单的开始:实现「楼下邻居老大爷」AI大模型
    3.集成智谱大模型到 LangChain
    ✅解读源码,拆解和自定义智能体
  3. 解读 OpenAI 工具回调风格智能体
  4. 解读 ReAct 风格智能体
    3.在LCEL框架下重定义《手撕AutoGPT》中的智能体
    ✅再现《手撕AutoGPT》:LangChain+智谱+智能体
  5. 定义工具
  6. 对比「OpenAI、ReAct和AutoGpt」这几个
    ✅🔗LangChain 智能体

这节课会带给你:

  • 🌹 一起阅读 LangChain 相关组件的源码,以便更好地阅读官方文档
  • 🌹 掌握 LangChain 文档中未曾提及、翻看源码才知晓的实用技巧
  • ✍️ 从零开始集成智谱大模型到 LangChain:解决智谱官方SDK不兼容的问题
  • ✍️ 按 LangChain 框架自定义一个智能体:再现《手撕AutoGPT》中的智能体

讲座: ChatU.AI和软积木创始人讲AGI落地

Check

今天的讲座课非常荣幸地邀请到了在大模型落地方面有丰富经验的刘海峰老师,他是 ChatU.ai 和 软积木 创始人,也是微软资深MVP(最有价值专家)和 PEC China 发起人。刘老师在多个领域拥有多年的经验,对技术的研究和探索也赢得业内广泛的赞誉和尊重。今天我们非常期待刘老师能够与我们分享他的理念和经验,让我们受益匪浅。

👉主题:ChatU.ai 企业落地经验
👨🏼‍🏫老师:刘海峰老师
🕙时间:今晚8点

大纲:
✅1. AI 技术革新与中美产品对比
a. AGI 如何引领行业变革,塑造全新商业生态
b. 创新思维在攻克 AI 难题中的关键作用
c. 从英伟达 GTC 看中美 AI 产品的差异
✅2. 企业在 AGI 应用落地中的挑战与应对策略
a. 企业在实施 AGI 落地时面临的困难与挑战
b. 实现 AGI 应用落地所需的关键要素与条件
c. ChatU.ai 应用落地的背景、意义及给企业带来的价值
d. 从安全性与稳定性方面解析 ChatU.ai 的能力和优势
✅3. ChatU.ai 落地方案的场景与案例深度剖析
a. ChatU.ai 在企业应用落地中的方法与策略
b. 教育领域:个性化学习解决方案的实施与成效
c. 大企业应用:提升工作效率的具体实践与案例分享
d. 客服优化:通过AI技术改善用户服务体验的创新举措
e. ChatU.ai 在不同行业与场景下成功经验的总结与启示
✅4. 展望未来AI发展趋势与企业应用前景
a. AI 行业的未来发展方向的分析与预判
b. 企业在AGI应用落地的前景预测与战略规划
c. 在未来企业 AGI 应用落地的建议与展望

13. 多模态大模型(上)

Check

👉主题:多模态大模型(上)
👨🏼‍🏫老师:多老师
👉老师介绍: C9 名校本硕博毕业,某大厂自研多模态大模型负责人。曾在多家大厂任职 P9 级别以上专家,国内 Top 5 水平。
因雇主公司原因,使用化名保密身份。

大纲:
✅多模态大模型的定义

  1. 跨模态模型
  2. 单模态大模型
  3. 多模态模型
  4. 多模态语言大模型
    ✅图文多模态模型的发展
  5. Vision Transformer
  6. 图像文本联合建模
  7. 大规模图-文 token 对齐模型(CLIP)
  8. 多模态大语言模型
    4.1. OpenAI GPT-4V
    4.2. Google Gemini
    ✅GPT-4V 实战

14. 多模态大模型(中)

Check

👉主题:多模态大模型(中)
👨🏼‍🏫老师:多老师
👉老师介绍: C9 名校本硕博毕业,某大厂自研多模态大模型负责人。曾在多家大厂任职 P9 级别以上专家,国内 Top 5 水平。
因雇主公司原因,使用化名保密身份。

大纲:
✅1.图文多模态大语言模型的评测
✅2.开源社区多模态大语言模型
✅3.开源 LLaVA 图文对话模型的训练
a.模型架构
b.训练过程
c.实战:数据构造与模型训练
✅4. LLaVA 应用衍生以及优化方向
✅5. 支持更多模态的大语言模型
a. X-LLM
b. NexT-GPT
✅6. Multi-Agent 多模态语言模型
✅7. LLM驱动的跨模态生成模型 -VideoPoet

15. 多模态大模型(下)

Check

👉主题:多模态大模型(下)
👨🏼‍🏫老师:多老师

大纲:
✅判别式模型 vs. 生成式模型
✅生成式模型技术路径一览

  1. AutoEncoder 自编码器
  2. VAE 变分自编码器
  3. Diffusion Model 扩散模型
    a. 原理与推导
    b. 整理训练、推理流程
    c. UNet 噪声预测网络
    d. DiT噪声预测网络
    e. 条件信息的引入
  4. Stable Diffusion 模型结构
    a. SD 模型 - 版本发展
    b. SD 模型 - 社区模型的优势与局限
    c. SD模型 - 实战
  5. 级联式文生图模型
  6. 文生图模型的应用拓展
    a. Image Inpainting / Outpainting
    b. 人脸、商品数字分身训练
    c. ControlNet
    d. 特征注入式引导 - IP-Adapter, InstantID
  7. SD 模型的加速方法
    a. 数据无关的蒸馏加速方法
    b. 数据有关的蒸馏加速方法
    ✅3D 目标生成方法一览
  8. 基于 NerF 的方法
  9. 基于扩散模型的方法
    ✅视频生成方法一览
  10. 视频编解码器 MagViT
  11. 视频生成方法简介

16. Al 产品部署和交付(上)

Check

👉主题:Al 产品部署和交付(上)
👨🏼‍🏫老师:西树老师
👉拥有近十年开发经验,7年带团队经验,从事web开发多年,前端、后端、服务架构都有涉猎,经历过大公司、创业公司,擅长前端及公司技术选型,拥有丰富的中后台开发经验,精通React技术栈,对前端生态有深入的研究,对服务架构方面,负载均衡,mysql主从复制,k8s、docker有颇深研究。

大纲:
✅1. 硬件选型
a. GPU
b. LPU
c.云服务厂商
d.算力平台
✅2. 带你了解全球大模型
✅3. 使用国产大模型服务
✅4. 搭建 OpenAl 代理
✅5. 热身:基于阿里云 PAI 部署 Stable Diffusion
✅6.在本地计算机运行大模型

17. AI 产品部署和交付(下)

Check

👉主题:AI 产品部署和交付(下)
👨🏼‍🏫老师:西树老师

大纲:
✅大模型的私有化部署
✅基于 vLLM 部署大模型
✅案例:如何优雅地在阿里云私有部署开源大模型
✅部署一套开源 LLM 项目
✅内容安全
✅互联网信息服务算法备案

18. 大模型时代的创业机遇

Check

👉主题:大模型时代的创业机遇
👨🏼‍🏫老师:孙志岗老师

大纲:
✅1. 大模型应用落地现状
✅2. 创业机遇
a.机会在哪?
b.怎样找到?
c.如何抓住?
✅3. 做独立开发者吗?
a.独立开发的前所未有机会
b.自己是否适合独立开发?
i.超高的自律要求
ii. 注册公司
iii. 日常事务
iv.兼职管理
v.其它困难
c.公司里的「独立开发者」
✅4. 产品研发新流程
✅5. 产品立项
a.如何找到真实需求
b.如何找到商业模式
c.关注种子推广渠道

讲座 : 智能算力那点事

Check

今天的讲座课非常荣幸地邀请到了David老师,他是来自国产算力芯片企业,负责市场工作。他会给我们做一次与 GPU 相关的科普讲座

👉主题:智能算力那点事儿
👨🏼‍🏫老师:David老师
🕙时间:今晚8点

大纲:
✅1. 关键词:芯片,算力,生态,商业
✅2. 人工智能三驾马车
✅3. 并行计算为 AI 加速
✅4. GPU 如何被制造出来
✅5. 英伟达的前世今生
a . 从计算机图形学说起
b. 显卡时代:1933-1999
c. GPU 时代:1999-2003
d. GPGPU 时代:2010-
e. GPU集群时代
f. 算力系统时代
✅6. 老黄的刀法
a. 冲破封锁线:赢得生态位的战争
b. 产品差异化:获得游戏和数据中心双赢
c. 需求加杠杆:通过金融放大需求
✅7. 技术路线:tradeoff 的胜利
a. SIMD
b. SIMT
c. DSA
d. 发展趋势
✅8. 优质算力的标准
a. 通用性:适应模型快速迭代
b. 易用性:满足开发人员需求
c. 有效性:理论算力高效利用
d. 低成本:满足运营成本需求
e. 可扩展性:满足不同类型的计算需求
✅9. 产业机会分享
a. 国产算力池:私有云
b. 大模型一体机:AI PC

20. 产品设计

Check

👉主题:产品设计
👨🏼‍🏫老师:孙老师

大纲:
✅功能、信息架构和交互设计
✅如何优雅地借鉴
✅写 PRD 是为了什么
✅AI 产品设计原则

  1. GitHub Copilot 总结四个关键支柱
  2. 实操总结七个经验
  3. UE/UX 设计经验
    ✅原型设计
  4. AI 生成:Galileo AI、v0 和 MasterGo
  5. 传统设计:draw.io、Figma 和 Motiff
    ✅极简 UI 设计原则
  6. 对齐
  7. 亲密
  8. 4 种颜色
  9. 4 的倍数
    ✅用 Gradio 快速搭原型
  10. 高仿 ChatGPT
  11. 高级界面定制
    ✅产品迭代
  12. 小而美的原则
  13. KANO 模型

21. 产品运营

Check

👉主题:产品运营
👨🏼‍🏫老师:孙老师

大纲:
✅运营

  1. 获客途径
  2. 转化要诀
  3. 留存有道
    ✅沟通
  4. 程序员怎么练沟通
  5. 沟通的内核
  6. 沟通的姿势
  7. 沟通的技巧
  8. 日常功夫
    ✅全课内核总结

22. 项目方案分析与设计

Check

👉课程主题:项目方案分析与设计

👨🏼‍🏫授课老师:王老师

🌟这期项目总结为👇~老师会重点拆解~大家一定要来上课哦![加油]
✅RAG相关
✅智能招聘相关
✅对话系统相关
✅其它复杂业务和专业领域问题

结课项目

Check

✅1. 面试通-李世元
✅2. 树洞投诉平台-PJ
✅3. AGI增强的数字孪生运营平台-z猫
✅4. 梦幻历史台-XwixGc
✅5. 福音有问必答项目-上官浪
✅6. Ybot陪伴成长儿童绘画讲故事机器人-嘟嘟
✅7. WALNUT AI大模型智能应答系统-tang
✅8. 电子电气架构文档开发机器人-王啸
✅9. AI报告生成助手-遐迩思成