「智(zhi)猩(xing)猩(xing)AI新(xin)青年讲座」由智(zhi)猩(xing)猩(xing)出品,致力于邀请(qing)青年学者(zhe),主(zhu)讲他们在生成式AI、LLM、AI Agent、CV等人工智(zhi)能领域的最新(xin)重要研究成果(guo)。

AI新青年是加速人工智能(neng)前沿研究(jiu)的(de)(de)新生力量(liang)。AI新青年的(de)(de)视(shi)频讲解和直(zhi)播(bo)答疑,将(jiang)可以帮助大家增进对人工智能(neng)前沿研究(jiu)的(de)(de)理解,相应(ying)领域的(de)(de)专业(ye)知识也能(neng)够得以积累(lei)加深。同时,通过与AI新青年的(de)(de)直(zhi)接(jie)交流(liu),大家在AI学习和应(ying)用(yong)AI的(de)(de)过程中遇到的(de)(de)问题,也能(neng)够尽快解决。

随着扩散模型技术的引入,文本到图像(Text-to-Image, T2I)生成技术迎来了显著的飞跃,现有模型在该领域展现出了卓越的创造力和表现力。尽管如此,文生图模型在使用语言颜色名称来指定对象颜色时,由于这些标签覆盖的颜色范围较广,难以实现精确匹配,且现有的文生图个性化方法往往会导致颜色-形状纠缠问题。为了实现T2I任务中的精准颜色生成,来自巴塞罗那自治大学LAMP组博士后王凯提出了ColorPeel模(mo)型,首次(ci)解决了color prompt learning(颜色提示学习)问(wen)题,相关论文为(wei)《ColorPeel: Color Prompt Learning with Diffusion Models via Color and Shape Disentanglement》,收(shou)录于(yu)ECCV 2024。

ECCV 2024 颜色生成新突破!首次解决文生图扩散模型中的颜色提示学习问题 | UAB博士后王凯讲座预告

ColorPeel是(shi)一种基于扩散(san)模型的(de)精确颜(yan)色(se)生成方法,其核心在(zai)于通过颜(yan)色(se)和形(xing)状的(de)解(jie)耦来提升T2I生成中颜(yan)色(se)的(de)精确度。

ColorPeel首先生成一系列基础的2D或(huo)3D几何形状(zhuang),并将(jiang)这些形状(zhuang)赋予用户指定的RGB颜(yan)色值或(huo)颜(yan)色坐标(biao),作(zuo)为训练数据。

扩散模型(xing)利用训(xun)练过程(cheng)中学到的(de)颜色(se)特征,结合用户提供的(de)颜色(se)提示,生成具有精确颜色(se)的(de)图像(xiang)。

ColorPeel中(zhong)引入一个(ge)创新的交叉注(zhu)意力对齐损(sun)失函数进行模(mo)型更新,旨在通过将颜(yan)(yan)色(se)和(he)形状(zhuang)从自动生成(cheng)的目标颜(yan)(yan)色(se)几何物体中(zhong)解耦,使得模(mo)型能够更准确地学习颜(yan)(yan)色(se)提示,避(bi)免颜(yan)(yan)色(se)和(he)形状(zhuang)特(te)征(zheng)的混合问题(ti)。

在生成阶(jie)段,用户通过(guo)提供文(wen)本(ben)描述和(he)颜(yan)色提示来指导(dao)图像的(de)生成。通过(guo)反向(xiang)扩散过(guo)程(cheng)逐(zhu)步(bu)恢(hui)复出图像的(de)颜(yan)色和(he)形状(zhuang)信息。这个过(guo)程(cheng)中(zhong),模型会不断(duan)优化(hua)图像,以确(que)保其颜(yan)色、形状(zhuang)以及整体风(feng)格(ge)与用户的(de)输入高度一致(zhi)。

ECCV 2024 颜色生成新突破!首次解决文生图扩散模型中的颜色提示学习问题 | UAB博士后王凯讲座预告

8月15日10点,智猩猩邀请到论文共同一作、巴塞罗那自治大学LAMP组博士后王凯参与「智(zhi)猩(xing)猩(xing)AI新青年讲(jiang)座(zuo)」247讲(jiang),主讲(jiang)《文生图扩(kuo)散模型中的精确颜色(se)生成》。

讲者

王凯

巴塞罗那自治大学LAMP组博士后

在吉林大学计算机科学与技术学院分别于2014年及2017年拿到本科及硕士学位。2022年博士毕业于西班牙巴塞罗那自治大学LAMP组,导师为Joost van de Weijer,主要研究课题为持续学习,vision transformer,扩散模型以及域适应等课题。毕业后至今留组作为博后指导多名博士生进行相关领域的研究工作。
第247讲主 题
文生图扩散模型中的精确颜色生成
提 纲
1、文生图扩散模型颜色生成存在的问题
2、基于LDM的文生图精确颜色生成方法ColorPeel
3、解耦颜色和形状以提升模型颜色学习能力
4、实验结(jie)果(guo)展示与扩展应用

直播信息

直播时间:8月15日10:00
直播(bo)地点:智(zhi)猩猩GenAI视频(pin)号(hao)

成果

论文标题
《ColorPeel: Color Prompt Learning with Diffusion Models via Color and Shape Disentanglement》
论文链接
//arxiv.org/abs/2407.07197
项目网站
//moatifbutt.github.io/colorpeel/
开源代码
//github.com/moatifbutt/color-peel

入群申请

本(ben)次讲(jiang)座(zuo)组(zu)建了学(xue)(xue)习(xi)交流群。加入学(xue)(xue)习(xi)交流群,除(chu)了可(ke)以观看直播,并提前拿到(dao)课件(jian)外,你还能结识更多(duo)研究人员和开发者,所提问题也将会(hui)优(you)先解答。

希望入群的朋友可以扫描下方二维码,添加小助手米娅进行申请。已添加过米娅的老朋友,可以给米娅私信,发送“ANY247”进行申请。

ECCV 2024 颜色生成新突破!首次解决文生图扩散模型中的颜色提示学习问题 | UAB博士后王凯讲座预告