「智(zhi)猩(xing)猩(xing)AI新(xin)青年讲座」由智(zhi)猩(xing)猩(xing)出品,致力于邀请(qing)青年学者(zhe),主(zhu)讲他们在生成式AI、LLM、AI Agent、CV等人工智(zhi)能领域的最新(xin)重要研究成果(guo)。
AI新青年是加速人工智能(neng)前沿研究(jiu)的(de)(de)新生力量(liang)。AI新青年的(de)(de)视(shi)频讲解和直(zhi)播(bo)答疑,将(jiang)可以帮助大家增进对人工智能(neng)前沿研究(jiu)的(de)(de)理解,相应(ying)领域的(de)(de)专业(ye)知识也能(neng)够得以积累(lei)加深。同时,通过与AI新青年的(de)(de)直(zhi)接(jie)交流(liu),大家在AI学习和应(ying)用(yong)AI的(de)(de)过程中遇到的(de)(de)问题,也能(neng)够尽快解决。

ColorPeel是(shi)一种基于扩散(san)模型的(de)精确颜(yan)色(se)生成方法,其核心在(zai)于通过颜(yan)色(se)和形(xing)状的(de)解(jie)耦来提升T2I生成中颜(yan)色(se)的(de)精确度。
ColorPeel首先生成一系列基础的2D或(huo)3D几何形状(zhuang),并将(jiang)这些形状(zhuang)赋予用户指定的RGB颜(yan)色值或(huo)颜(yan)色坐标(biao),作(zuo)为训练数据。
扩散模型(xing)利用训(xun)练过程(cheng)中学到的(de)颜色(se)特征,结合用户提供的(de)颜色(se)提示,生成具有精确颜色(se)的(de)图像(xiang)。
ColorPeel中(zhong)引入一个(ge)创新的交叉注(zhu)意力对齐损(sun)失函数进行模(mo)型更新,旨在通过将颜(yan)(yan)色(se)和(he)形状(zhuang)从自动生成(cheng)的目标颜(yan)(yan)色(se)几何物体中(zhong)解耦,使得模(mo)型能够更准确地学习颜(yan)(yan)色(se)提示,避(bi)免颜(yan)(yan)色(se)和(he)形状(zhuang)特(te)征(zheng)的混合问题(ti)。
在生成阶(jie)段,用户通过(guo)提供文(wen)本(ben)描述和(he)颜(yan)色提示来指导(dao)图像的(de)生成。通过(guo)反向(xiang)扩散过(guo)程(cheng)逐(zhu)步(bu)恢(hui)复出图像的(de)颜(yan)色和(he)形状(zhuang)信息。这个过(guo)程(cheng)中(zhong),模型会不断(duan)优化(hua)图像,以确(que)保其颜(yan)色、形状(zhuang)以及整体风(feng)格(ge)与用户的(de)输入高度一致(zhi)。

8月15日10点,智猩猩邀请到论文共同一作、巴塞罗那自治大学LAMP组博士后王凯参与「智(zhi)猩(xing)猩(xing)AI新青年讲(jiang)座(zuo)」247讲(jiang),主讲(jiang)《文生图扩(kuo)散模型中的精确颜色(se)生成》。
讲者
王凯
巴塞罗那自治大学LAMP组博士后
文生图扩散模型中的精确颜色生成
提 纲
1、文生图扩散模型颜色生成存在的问题
2、基于LDM的文生图精确颜色生成方法ColorPeel
3、解耦颜色和形状以提升模型颜色学习能力
4、实验结(jie)果(guo)展示与扩展应用
直播信息
直播时间:8月15日10:00
直播(bo)地点:智(zhi)猩猩GenAI视频(pin)号(hao)
成果
论文标题
《ColorPeel: Color Prompt Learning with Diffusion Models via Color and Shape Disentanglement》
论文链接
//arxiv.org/abs/2407.07197
项目网站
//moatifbutt.github.io/colorpeel/
开源代码
//github.com/moatifbutt/color-peel
入群申请
本(ben)次讲(jiang)座(zuo)组(zu)建了学(xue)(xue)习(xi)交流群。加入学(xue)(xue)习(xi)交流群,除(chu)了可(ke)以观看直播,并提前拿到(dao)课件(jian)外,你还能结识更多(duo)研究人员和开发者,所提问题也将会(hui)优(you)先解答。
希望入群的朋友可以扫描下方二维码,添加小助手米娅进行申请。已添加过米娅的老朋友,可以给米娅私信,发送“ANY247”进行申请。
