宇宙链 宇宙链
Ctrl+D收藏宇宙链

Stable Diffusion 团队放大招!新绘画模型直出 AI 海报,像素级生成

作者:

时间:1900/1/1 0:00:00

来源:量子位

开源AI绘画扛把子,StableDiffusion背后公司StabilityAI再放大招!

全新开源模型DeepFloydIF,一下获星2千+并登上GitHub热门榜。

DeepFloydIF不光图像质量是照片级的,还解决了文生图的两大难题:

准确绘制文字。

Chainlink计划今年推出Chainlink Staking v0.1版本:6月8日消息,Chainlink官方发文介绍Chainlink Staking的长期目标、路线图和初步实施计划。Chainlink表示,Staking的引入是一个关键时刻,标志着Chainlink Economics 2.0的发展,后者是Chainlink长期安全和网络经济的新时代。

Chainlink Staking的四个长期目标如下:增加Chainlink服务的加密经济安全性和用户保障;让社区参与Chainlink网络;从真正的长期使用中获得可持续的回报(提供基本奖励、合作伙伴成长计划);让节点运营者通过质押获得更高价值的工作。

初步实施方面,Chainlink Staking将发展为多个版本,预计今年晚些时候将发布最初的v0.1版本。第一个版本的重点是引入声誉框架和质押者警报系统。经过充分验证后,v1版本将引入额外的功能,如份额罚没(slashing)以增强加密经济安全,并纳入用户费用作为奖励。此外,v2版本将探索引入损失保护,以在受支持的预言机网络偏离其链上服务级别协议(SLA)时帮助保护参与的发起人。[2022/6/8 4:09:34]

以及准确理解空间关系。

Blockdaemon 宣布对以太坊上的流动质押协议 StakeWise 进行战略投资:3月3日消息,区块链基础设施公司 Blockdaemon 宣布对以太坊上的流动质押协议 StakeWise 进行战略投资,将共同为金融机构和大型科技公司提供质押解决方案。Blockdaemon与 StakeWise 的合作将为机构客户创建基于 KYC 的流动质押解决方案。”Blockdaemon 首席执行官兼创始人 Konstantin Richter 表示,通过在以太坊网络上构建机构级的流动性质押产品,将为有严格合规要求的客户开辟途径,以利用质押资本进行借贷、期权写入、流动性提供等。[2022/3/3 13:34:51]

铝矿商Rio Tinto推出区块链可持续解决方案START:铝矿商Rio Tinto(力拓集团)宣布推出一款名为START的分布式账本技术(DLT)驱动解决方案。该公司表示,START旨在促进负责任和可持续的铝采购。(BTCManager)[2021/2/5 19:00:59]

网友表示,这可是个大事,之前想让Midjourneyv5在霓虹灯招牌上写个字AI都是瞎划拉两笔,对于镜子理解的也不对。

使用DeepFloydIF,可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字都会以合适的字体、风格、排版出现在合理的地方。

BKEX Global将于今日16:30上线STAKE:据BKEX Global公告,BKEX Global将于2020年8月19日16:30(UTC+8)上线STAKE(xDAI Stake),开放交易对:STAKE/USDT。

xDai Chain是一个由MakerDAO基金会与POA Network联合推出的美元稳定币区块链,也是一个与以太坊兼容的侧链,其使用稳定币xDai作为基础代币用于交易和支付gas费用,并通过STAKE代币,借助独特的权益证明算法POSDAO来进行记账和治理。[2020/8/19]

这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。

动态 | Globitex交易所宣布和Bitfury Crystal合作以提高平台合规性:2月26日消息,加密货币交易所Globitex宣布和Bitfury Crystal合作以提高平台合规性。在欧盟第五次指令(5AMLD)之后,与Bitfury Crystal的合作,将使Globitex向其客户提供符合监管标准的AML和CFT(打击资助恐怖主义)合规服务。(RealWire )[2020/2/26]

还在视频特效上开辟了新方向。

目前DeepFloydIF以非商用许可开源,不过团队解释这是暂时的,获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloydIF仍然基于扩散模型,但与之前的StableDiffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。

官方还提供了一组DeepFloydIF与其他AI绘画模型的直观对比。

可以看出,使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字,AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源,谷歌的几个模型更是连个Demo都不给,DeepFloydIF就成了更实际的选择。

具体生成图像上DeepFloydIF与之前模型一致,语言模型理解文本后先生成64×64分辨率的小图,再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上,通过把指定图像缩小回64×64再使用新的提示词重新执行扩散,也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外,DeepFloydIF的优势还在于,IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中,IF-4.3B取得了最好的FID分数,并达到SOTA。

谁是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的独立研发团队,深受摇滚乐队平克弗洛伊德影响,自称为一只“研发乐队”。

主要成员只有4人,从姓氏来看均为东欧背景。

这次除了开源代码外,团队在HuggingFace上还提供了DeepFloydIF模型的在线试玩。

我们也试了试,很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多,不过既然开源了,相信在中文数据集上训练好的变体也不会太晚出现。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在开源上的唯一动作

语言模型方面,他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna,基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

DeepfloydIF在线试玩:

https://huggingface.co/spaces/DeepFloyd/IF

代码:

https://github.com/deep-floyd/IF

StableVicuna在线试玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接:

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

标签:STADEEPFLOPFLSTAKD价格Deeper Networkaifloki币上哪家交易所PFL币

fil币价格今日行情热门资讯
商业银行 "ChatGPT" 专利哪家强?

来源|零壹财经 作者|严井池 图片来源:由无界AI工具生成人工智能是引领未来的新兴战略性技术,是驱动新一轮科技革命和产业变革的重要力量。人工智能概念自1956年正式提出以来,历经60多年的发展,已进入第三次热潮.

1900/1/1 0:00:00
veDAO研究院:比特币NFT协议Ordinals生态汇总

NFT作为可以代表独一无二的数字资产或实物资产的加密代币,它在区块链上具有唯一性和不可替代性。NFT在以太坊等智能合约平台上已经发展了多年,诞生了许多著名的项目和应用.

1900/1/1 0:00:00
错过BRC-20?ORC-20已来 能否抢占市场?

原标题:ORC-20代币解读:ordinals生态中新的发币规则ORC-20官方文档:https://docs.orc20.org/在ordinals中,凡是用json铸造铭文然后解读的,大概率是把铭文当草纸用了.

1900/1/1 0:00:00
扎克伯格:生成式AI將觸及Meta所有產品 不放棄元宇宙

扎克伯格说,生成式人工智能“实际上将触及我们的每一个产品”,“随着时间的推移,这也将扩展到我们在元宇宙方面的工作,人们将更容易创造化身、物品、世界,以及将所有这些联系起来的代码.

1900/1/1 0:00:00
Ordinals 与 BRC-20热潮下,盘点比特币可扩展性发展的四大方向

原文:Top?4?Directions?of?Bitcoin?Ecosystem?Scalability作者:kenyou由GweiResearch编译 Ordinals?NFT?和?BRC-20?代币的出现.

1900/1/1 0:00:00
万字拆解 NFT 巨头 Yuga Labs:从零到 “Web3 迪士尼” 只用了两年

原文来源于Dappradar,白泽研究院编译。因篇幅原因略有内容删改,建议感兴趣的读者阅读原文:https://dappradar.com/blog/yuga-labs-from-nothing-to-the-disney-of-we.

1900/1/1 0:00:00