智东西(公众号:zhidxcom)
作者 | 江宇
编辑 | 漠影
智东(dong)西9月24日(ri)报道,阿里巴(ba)巴(ba)旗下夸克今日(ri)发布全新AI创作平台“造点”,集成(cheng)图像与(yu)视频生(sheng)成(cheng)能力,并接入最(zui)新版本的通义万相模型Wan2.5,成(cheng)为目前(qian)国内首个(ge)支持“音画同步”生(sheng)成(cheng)的公开平台。

用户可(ke)通(tong)过(guo)输入文本(ben),一键生(sheng)成图(tu)像(xiang)或视频(pin)。此(ci)外,在视频(pin)生(sheng)成方(fang)面,通(tong)义(yi)万相Wan2.5支持(chi)10秒(miao)长度、24帧(zhen)每秒(miao)、1080P分辨(bian)率,并(bing)可(ke)同(tong)步生(sheng)成语音、音效与背景(jing)音乐(le),实现更完整的故(gu)事(shi)表达(da)。
通义万(wan)相Wan2.5还具备(bei)较强的(de)指令响应能(neng)力,可在(zai)生(sheng)成(cheng)过(guo)程中呈现运镜等连续变化效果。
图(tu)像(xiang)生(sheng)成方(fang)面,“造(zao)点”引(yin)入了Midjourney V7模型,并结合夸克(ke)自研算法(fa)进行本地化(hua)(hua)优化(hua)(hua),突(tu)出亚洲人像(xiang)、中(zhong)文(wen)文(wen)字及国风(feng)(feng)视觉(jue)表现(xian)能(neng)(neng)力。该平台支持多图(tu)参考、风(feng)(feng)格代(dai)码、精(jing)细参数调节(jie)等功能(neng)(neng),还面向电商设计(ji)、影游内容创作等专(zhuan)业场景开放(fang)使用。
目前,用(yong)户可访问官网或通(tong)过夸克(ke)PC端“AI生(sheng)图(tu)”入(ru)口进入(ru)“造点”。移动端则(ze)支持(chi)“一句话P图(tu)”“AI创意视频(pin)”“风(feng)格(ge)转化”等功(gong)(gong)能(neng)(neng)。截止(zhi)至9月30日(ri),通(tong)义万相Wan2.5视频(pin)生(sheng)成功(gong)(gong)能(neng)(neng)将面向用(yong)户开(kai)放免费体验。

相(xiang)比(bi)单一(yi)模型或(huo)单一(yi)模态的工具,“造点(dian)”在(zai)一(yi)个(ge)平台内(nei)集成(cheng)图(tu)像与(yu)视频生成(cheng)能力,尝试覆(fu)盖更多创(chuang)作需(xu)求。依托通义万相(xiang)与(yu)Midjourney等(deng)主(zhu)流模型的集成(cheng),该平台在(zai)提(ti)升生成(cheng)质(zhi)量的同时,也降低了内(nei)容创(chuang)作的门(men)槛(jian)。
从当前开放(fang)功能来看,其在画质呈现、音画同步上的表现已有初(chu)步完成度,但在长视频生成、多轮调整等方面仍有待后续观察(cha)。