gamesuck 发表于 2025-4-18 05:00

rk0681-LLM 多模态视觉大模型【VIP】


——/LLM 多模态视觉大模型/
├──1.大模型技术概述
|   └──1. 视觉大模型技术概述.mp421.88M
├──2.自监督学习的原理与方法
|   ├──2.1自监督学习与前置任务.mp417.74M
|   ├──2.2对比学习与SimCLR.mp418.62M
|   ├──2.3Moco模型.mp411.71M
|   ├──2.4MoCo代码详解.mp423.52M
|   └──2.5掩码重建与BEiT.mp410.54M
├──3.视觉基础大模型的架构
|   ├──3.1 ViT与其变种.mp415.14M
|   ├──3.2 MoCo v3自监督骨干网络.mp47.81M
|   ├──3.3 DINO模型.mp412.63M
|   ├──3.4 DINO代码详解.mp417.19M
|   ├──3.5 MAE模型.mp49.64M
|   ├──3.6 MAE代码详解.mp426.33M
|   └──3.7 SAM模型.mp423.55M
├──4.多模态视觉大模型
|   ├──4.1 多模态学习的概念.mp428.11M
|   ├──4.2 多模态网络的架构.mp423.62M
|   ├──4.3 CLIP模型.mp419.34M
|   ├──4.4 CLIP代码详解.mp428.17M
|   ├──4.5 GLIP模型.mp411.26M
|   ├──4.6 Flamingo模型.mp427.58M
|   └──4.7 LLaVA模型.mp444.59M
├──5.下游任务迁移与视觉提示
|   ├──5.1 线性探测与微调.mp48.80M
|   ├──5.2 线性探测与微调代码详解.mp412.66M
|   ├──5.3 Adapter方法.mp413.31M
|   ├──5.4 Adapter代码详解.mp455.46M
|   ├──5.5 视觉prompt方法.mp458.06M
|   ├──5.6 视觉Prompt代码详解.mp436.99M
|   └──5.7 小结.mp43.56M
├──6.实战-多模态大模型微调
|   ├──6.1 PandaGPT框架介绍.mp444.93M
|   ├──6.2 环境与模型配置.mp4108.10M
|   ├──6.3 项目代码通览.mp4109.86M
|   ├──6.4 数据集加载.mp494.70M
|   ├──6.5 模型定义.mp4144.59M
|   ├──6.6 模型实现.mp4234.10M
|   ├──6.7 Demo运行.mp462.57M
|   ├──code .zip27.63M
|   ├──Vicuna模型加载指南.txt0.37kb
|   └──端口映射方法.txt0.08kb
├──7.实战-基于视觉提示的下游迁移
|   ├──7.1 VPT框架通览.mp4127.32M
|   ├──7.2 数据集加载.mp4109.92M
|   ├──7.3 模型定义.mp4155.92M
|   ├──7.4 模型实现1.mp494.20M
|   ├──7.5 模型实现2.mp476.86M
|   ├──7.6 病理图像下游迁移.mp443.75M
|   ├──BCI数据集下载.txt0.87kb
|   └──code .zip1021.61kb
├──code
|   ├──adapter.py3.84kb
|   ├──CLIP.py3.27kb
|   ├──DINO.py3.13kb
|   ├──linear-probing.py1.69kb
|   ├──MAE.py4.34kb
|   ├──moco.py2.23kb
|   ├──prompt-tuning.py3.26kb
|   └──全部代码压缩包.zip9.74kb
├──PPT
|   ├──0.视觉大模型课程前置介绍.pptx1.90M
|   ├──1.大模型技术概述.pptx5.31M
|   ├──2.自监督学习的原理与方法.pptx3.04M
|   ├──3.视觉基础大模型的架构.pptx3.02M
|   ├──4.多模态视觉大模型.pptx4.79M
|   └──5.下游任务迁移与视觉提示.pptx1.59M
├──论文
|   ├──Gemini-A Family of Highly Capable Multimodal Models.pdf25.69M
|   ├──ImageBind-One Embedding Space To Bind Them All.pdf6.34M
|   └──InternVL-Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks.pdf1.25M
└──PPT.zip19.13M


muzos 发表于 2025-4-18 06:41

强烈支持楼主ing……

laoda1228 发表于 2025-4-18 07:06

rk0681-LLM 多模态视觉大模型【VIP】

monkeyman 发表于 2025-4-18 07:17

非常好的vip

wsx123 发表于 2025-4-18 07:35

感谢分享。。

ruiclc 发表于 2025-4-18 07:41

77777777777777777777777777777777

preach123 发表于 2025-4-18 08:16

111

travelerly 发表于 2025-4-18 08:19

:)

sanshiyi 发表于 2025-4-18 08:27

:)

tomslee 发表于 2025-4-18 08:29

111111111111111
页: [1] 2 3 4 5 6
查看完整版本: rk0681-LLM 多模态视觉大模型【VIP】