自(zì)聊天机(jī)器(qì)人ChatGPT火爆以来,微软公(gōng)司创始(shǐ)人比尔·盖茨(cí)已多次公开谈论(lùn)人工(gōng)智能话题。在最近的(de)一次(cì)采访中,他再(zài)次(cì)表示(shì):“AI可能(néng)会让科技行业迎(yíng)来一次剧烈的洗牌”。
这个(gè)结论是(shì)他在当地(dì)时间2月20日接受《In Good Company》节(jié)目(mù)专访时提(tí)出(chū)的。
他预(yù)期,AI的发展已婚男人睡完你后的心态,已婚男的得到你一次之后可能会威胁(xié)到谷歌(gē)的市占率,因为微(wēi)软在AI方面的行动相当迅速(sù)。而(ér)最终科技巨头将把AI整合成用户(hù)的“全能助手”,包揽(lǎn)一切应用,与人们进(jìn)行沟通(tōng)并提供建(jiàn)议,可(kě)以取代亚(yà)马逊、Siri或Outlook等应用。
大佬(lǎo)口中全能助(zhù)手的到来可能尚需时日,但由(yóu)ControlNet引发的又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中(zhōng)杀出重围。
01
ControlNet颠覆AI绘画新玩法
AIGC向(xiàng)可控靠近
以(yǐ)AI绘画为代表(biǎo)的AIGC上一次爆火的(de)时候,还是2022年8月,在美国科(kē)罗拉(lā)多(duō)州举(jǔ)办的新兴数字艺术家竞赛中,一幅名为《太空歌剧院(yuàn)》的作品获奖。
随后各(gè)大厂商(shāng)的AI绘(huì)画软件(jiàn)被(bèi)广大网友熟知并体验,Stable Diffusion便是其中代表。
用户们可(kě)以(yǐ)在应用(yòng)中输入(rù)一组关键词或者(zhě)一张照片,就(jiù)能获(huò)得一幅AI创作的画作(zuò)。
作(zuò)画的关键就(jiù)是(shì)所输入的文本。同一组(zǔ)关键词也可以创作出(chū)很多张风格不(bù)一样(yàng)的画作(zuò),这让创作的过程就像开(kāi)盲盒。
很多(duō)用户很喜欢(huān)这种不确定(dìng)的惊喜(xǐ),他们会将生成的美(měi)图当做(zuò)头像。而另(lìng)一部分(fēn)喜欢翻看AI绘画的“翻车”作(zuò)品。在社(shè)交(jiāo)媒体上(shàng),许多(duō)用(yòng)户分享AI“翻车现场”,例如(rú),一位网友(yǒu)的小狗照片被AI画成了“肌(jī)肉(ròu)男”,还有网(wǎng)友的个(gè)人照片被(bèi)AI识别(bié)成(chéng)了(le)建筑。
而如今(jīn)随着ControlNet的出(chū)现与加持,以往AI绘画的填(tián)写关键(jiàn)词游戏可(kě)能要被颠覆了。
ControlNet是一位正在斯(sī)坦福读博(bó)的中国人(rén)张吕敏创作的(de)一种基于(yú)控制点的图像(xiàng)变(biàn)形算法(fǎ),主(zhǔ)要用(yòng)于数字(zì)图像(xiàng)处(chù)理、计算(suàn)机视觉和计(jì)算机图形学等领域(yù)。
其SD插(chā)件一经(jīng)发布,在短短的两(liǎng)天内便(biàn)成(chéng)为了AI绘画领域最新的(de)热点。
在此(cǐ)之前,大家用了很多(duō)方法想让AI生成的结果尽可(kě)能的符合(hé)要求,但是都不尽如(rú)人意,它的(de)出现代表着AI生成(chéng)开始进入(rù)真正的可(kě)控(kòng)时期。
因(yīn)为(wèi)ControlNet可以(yǐ)直(zhí)接提取画(huà)面的构图,人物的姿势和画面(miàn)的深度信息等。有(yǒu)了(le)它的(de)帮助,就(jiù)不用频繁(fán)的用提(tí)示词来(lái)碰(pèng)运气,抽(chōu)盲盒式的创作了。
通俗(sú)的(de)说ControlNet相(xiāng)当于给AI绘画加了“魔法(fǎ)”,不少博主的作品已(yǐ)经(jīng)获得了大量的浏览量,“viggo”就是(shì)其(qí)中之一,他(tā)用(yòng)朋友(yǒu)的照片直接带她(tā)们走进动(dòng)漫世界(jiè)。
viggo先用StableDiffusion图片(piàn)转文(wén)字(zì)。
再用Text2Prompt插件拓展(zhǎn)找到对(duì)应的关键词;最(zuì)后(hòu)用(yòng)ControlNet插件绑定骨骼开始换关键词试(shì)效果。
已婚男人睡完你后的心态,已婚男的得到你一次之后-s="300,640" data-type="jpeg" data-w="1280">
通过图片(piàn)就(jiù)可以看出来,效(xiào)果(guǒ)十分惊(jīng)艳。
更(gèng)厉(lì)害的是(shì),除了真实的(de)照(zhào)片,草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现(xiàn)线稿(gǎo)转(zhuǎn)全彩图。大神张吕敏其本尊也(yě)亲自回应。
不得(dé)不(bù)说当下AIGC已经变(biàn)得(dé)越来越(yuè)强大,甚至输出的(de)作(zuò)品都已(yǐ)经(jīng)能(néng)以(yǐ)假乱真(zhēn)了。
02
难辨虚实,AIGC技术力爆发(fā)
警惕(tì)安全(quán)问题
近日(rì),“苏(sū)州(zhōu)金鸡湖(hú)有游艇(tǐng)party”的消息火遍网络(luò),而经过警方辟谣(yáo)这所谓(wèi)的(de)“party”可(kě)能是全国(guó)第一起AI绘图诈骗(piàn)。
由于这(zhè)个活动里面(miàn)给出(chū)的美(měi)女照片都(dōu)是AI制作的真人照片(piàn)绘图,因为太逼真,被大家当(dāng)成真(zhēn)事传(chuán)播(bō)了。
不(bù)过仔细观察(chá)可以发现,活动发(fā)起(qǐ)者(zhě)提供的照片中(zhōng)有(yǒu)个很大的漏洞可(kě)以发现并非真(zhēn)人,而是AI绘图,那便是(shì)图片中女性的手指部分有的(de)存在异(yì)常(cháng)。
有行业人事(shì)表示:“现在因(yīn)为(wèi)手指部分的绘画算(suàn)法比较(jiào)复杂,AI还不太会画人的手,但最(zuì)新看到(dào)的图片已经(jīng)有越(yuè)来越(yuè)完美的AI模型出现,以后可(kě)能就完全没有(yǒu)漏洞了。”
类似的AI作图诈(zhà)骗(piàn)在国外也(yě)已有发生。据英国广播公(gōng)司报(bào)道,土耳其地震期间,有Tiktok用户(hù)使用AI合成(chéng)了儿童(tóng)受灾的假照片(piàn)发布到(dào)网络(luò),以此诱骗善良(liáng)的人打赏“捐助”从而实施(shī)诈(zhà)骗。
目前随着技术发(fā)展,AIGC已经能做出真人照片般的绘图(tú)效果,如果这样的图片被用(yòng)来诈骗,将非常可怕。
此外AIGC还引发了很(hěn)多担忧,一方面,批判者认为AI在“学习”了大量前人的作品(pǐn)之后(hòu),其(qí)创作没有任何情(qíng)绪和灵魂,难以和人类(lèi)的(de)艺(yì)术创(chuàng)作相提并(bìng)论(lùn)。
另一方面,AIGC背后的(de)版权、目(mù)前都并(bìng)没(méi)有得到有(yǒu)效的解决,还(hái)有AIGC会(huì)不会代(dài)替人类“至高无上”的创意。
马斯克也强(qiáng)调,人工(gōng)智能的(de)安全问题需要得到重视,太晚(wǎn)就来不及了。
03
AIGC下一(yī)站除了视频,还(hái)有远(yuǎn)方(fāng)
技术都是有两面性的,潜(qián)在(zài)的危(wēi)害并不能(néng)掩盖(gài)其光辉的贡献。现(xiàn)在(zài)看(kàn)来,人(rén)工智能技(jì)术将是第(dì)四次(cì)工业革(gé)命的核心(xīn)驱动力量,将创造新(xīn)的(de)增长奇迹。
过去一年,人(rén)工智能在技(jì)术(shù)和商业层面都有了巨大进展,AI绘画就(jiù)是(shì)人工智能技(jì)术发生(shēng)方向性(xìng)改变(biàn)的一个代表。其下一站或许(xǔ)就是视频。
此前,Meta和谷歌先(xiān)后发布了几条(tiáo)引爆科(kē)技圈的短视频。这(zhè)些视频引发关(guān)注并非(fēi)内容做得多优秀,反(fǎn)而都(dōu)非(fēi)常简单,比如一匹正在(zài)喝水的马(mǎ),一只画(huà)画的玩具熊,或(huò)者一段骑(qí)摩托车的(de)第一视角录像,随便一个有手机的人都可以随手(shǒu)录下一段。
但这(zhè)些短(duǎn)视频的创作方式(shì)非常简单,创作者仅仅(jǐn)需(xū)要向AI输入一段话(huà),甚至只是(shì)说一下要求(qiú),AI就可以根(gēn)据(jù)需要生成一段视频。
谷歌发布(bù)的(de)两个(gè)AI生成视频分别来自于(yú)Imagen Video和Phenaki,前者(zhě)主要(yào)突出的是高(gāo)清,与Meta的Make-A-Video没有太多(duō)的差别。
在Make-A-Video公布了AI生成的视频后,AI圈就已经玩(wán)了一波梗,一个能够做出(chū)更(gèng)高清视(shì)频的(de)AI还不足以在(zài)短时间(jiān)内戳中兴奋点。
Phenaki更加令人(rén)震(zhèn)惊的地方(fāng)在于,它可以(yǐ)制作(zuò)出超过(guò)2分钟的连贯的也有确切内(nèi)容的视频,这才是真(zhēn)正让人们感到惊喜(xǐ)的(de)地方。因为无论AI生(shēng)成的视频(pín)多么高清,也(yě)只能是(shì)为内容(róng)生产者提供一个(gè)灵感,一个素材,一个过场动画(huà)。
不(bù)过能够(gòu)制作(zuò)出有具体剧情内(nèi)容的视(shì)频就(jiù)意味着,一些视频(pín)创作(zuò)由(yóu)AI代替(tì)人(rén)工完成已经初步有了可能。
当下(xià)AI的(de)发展(zhǎn)速度已(yǐ)经超过大部分人的(de)想象。内容(róng)产(chǎn)业的本质(zhì)是(shì)供给创造需(xū)求,AIGC作为全(quán)新的内(nèi)容生产方式,可以(yǐ)为内容产(chǎn)业带来(lái)更(gèng)新的内容风格(gé)、更快的生产速度,更低(dī)的生产成本,这无(wú)疑会驱动内容产(chǎn)业的(de)大(dà)爆(bào)发。
除(chú)了AI绘图、视频,AIGC技术还能(néng)应用于音乐、代码、机器人动作等(děng)多(duō)种内容形式的生成(chéng)。不难发现该(gāi)项技术(shù)不(bù)仅在游戏等行业能得到有效应用,对(duì)于下一代互联网(wǎng)各种(zhǒng)元素的构建亦有关键意义。
从商业(yè)化的角(jiǎo)度(dù)来看,文化娱乐、教育(yù)、传媒(méi)等诸多领域,本身就对(duì)基于AI的可视化内(nèi)容(róng)有强烈需求。
因此,AI绘画及视频(pín)或不是结(jié)果,而只是AI进程中的(de)一(yī)块重要(yào)拼图,有望(wàng)在技术(shù)更新的加持(chí)下实现更大的(de)应用价值。
AI从理(lǐ)解内容(róng),走(zǒu)向了(le)可以生(shēng)成(chéng)内(nèi)容(róng),甚至能够(gòu)创造出独立价值和独立(lì)视角的(de)内容。AIGC的再次出(chū)圈,更代表(biǎo)着未来的先进生产(chǎn)力(lì)即将(jiāng)到(dào)来。
04
紧抓(zhuā)大(dà)模型(xíng)与算力(lì),牢固AIGC底(dǐ)座
从技术的(de)发(fā)展(zhǎn)也可以看出(chū),在语(yǔ)言大(dà)模型、图像大模型之(zhī)后,多模(mó)态大模(mó)型已经成为了(le)新的趋(qū)势。
大模型被誉(yù)为当前人工智能发展(zhǎn)的智(zhì)能底座(zuò),是全球(qiú)竞争最激烈的(de)研究(jiū)方向(xiàng)之一,包括(kuò)谷歌、亚(yà)马逊、百度、阿里、腾(téng)讯等众多头(tóu)部(bù)企业都在竞(jìng)相发力。
不过训练大模(mó)型的确价格(gé)不菲(fēi),以国盛证券发布的《ChatGPT需要多少算(suàn)力(lì)》报(bào)告估算,GPT-3训练一(yī)次的成本约为140万美元。而对于一(yī)些更大的LLM(大型(xíng)语言模(mó)型),训(xùn)练成本则介于200万美(měi)元(yuán)至1200万(wàn)美元(yuán)高(gāo)价之间。
以(yǐ)ChatGPT在2023年1月的独立访客平均数1300万计算,其对应(yīng)芯片需(xū)求为3万多片(piàn)英伟达A100 GPU,初始投入(rù)成本约(yuē)为8亿美元(yuán),每日仅电费就在5万美元(yuán)左右。
此外(wài)不论是ChatGPT还是AIGC,都离不(bù)开庞大(dà)算力支持。在关注各类大模型的发展同(tóng)时,更应该关注算(suàn)力网络的(de)建设(shè)。
算(suàn)力网(wǎng)络正驱动AI产(chǎn)业发展进入(rù)史诗级加速进程(chéng),让AIGC及(jí)通用(yòng)AI这一人工(gōng)智能(néng)发展的终(zhōng)极目标离(lí)得(dé)更近。
因为(wèi)算力可以对突破性技术创新提供(gōng)大力的支持。这方面,多模态大模(mó)型是典(diǎn)型。作为(wèi)面向未(wèi)来强人工智能、通用人工智能的重要技术创新,多模态大(dà)模型已经在人(rén)工智能(néng)领(lǐng)域提出了很多年,业界也有不少技术突破,但是,多(duō)模(mó)态(tài)大(dà)模型进一步(bù)往下走(zǒu),算力需求呈几何(hé)式上升,一般的算(suàn)力基础设施很快(kuài)将难以胜任。
从图(tú)像、文字(zì)、语音(yīn)单独一(yī)项的训练,到双模态、三模态(tài)的跃迁,让人工智(zhì)能可以灵活应对(duì)不(bù)同模态的转化、像(xiàng)人与世界交互一样自然(rán),这方面,由算力网络来驱动将有明显优势。
此外,还有很多需要(yào)爆发式增(zēng)长(zhǎng)的算(suàn)力来支撑的技术创(chuàng)新(xīn),将在人工智能算力(lì)网络支撑下快速推进。已婚男人睡完你后的心态,已婚男的得到你一次之后strong>
AIGC已经(jīng)露(lù)出曙光,期待在大模型和大(dà)算力(lì)的支持(chí)下AIGC能(néng)持续颠覆内(nèi)容生产(chǎn)的方式,将(jiāng)创(chuàng)造的边际成本降低(dī),让(ràng)万众受(shòu)益。
未经允许不得转载:橘子百科-橘子都知道 已婚男人睡完你后的心态,已婚男的得到你一次之后
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了