橘子百科-橘子都知道橘子百科-橘子都知道

中国为什么叫兔子国

中国为什么叫兔子国 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来(lái),微软公司(sī)创始(shǐ)人(rén)比尔·盖茨已多次公开谈论(lùn)人(rén)工(gōng)智能话题。在最近的一次采访(fǎng)中(zhōng),他再次(cì)表示:“AI可能会让科技行(xíng)业迎来(lái)一次(cì)剧烈的洗牌(pái)”。

这个结论(lùn)是(shì)他在当(dāng)地时间2月20日接受《I中国为什么叫兔子国n Good Company》节目专(zhuān)访时提出的(de)。

他预期,AI的发(fā)展可能(néng)会(huì)威胁到(dào)谷(gǔ)歌(gē)的市占率(lǜ),因(yīn)为微软在(zài)AI方面的行(xíng)动相(xiāng)当(dāng)迅速。而最终科技巨头将(jiāng)把AI整(zhěng)合(hé)成用户的“全能助手”,包揽一切应用(yòng),与(yǔ)人们进(jìn)行沟通并提(tí)供建议,可以取代亚马(mǎ)逊、Siri或Outlook等应用。

大佬口中全能助手的到(dào)来可能尚需时(shí)日,但由ControlNet引发的(de)又一次AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点包围中杀出重(zhòng)围。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的(de)时候,还(hái)是2022年(nián)8月,在美国科罗拉多州举办(bàn)的新兴(xīng)数字艺术家(jiā)竞赛中,一幅名为《太空(kōng)歌剧(jù)院》的作(zuò)品获(huò)奖。

随后各大厂商的AI绘画软件被广大网友(yǒu)熟知并体(tǐ)验,Stable Diffusion便是其中代表。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科技(jì)行业?_黑料正能量

用户们可以在(zài)应用(yòng)中输(shū)入(rù)一组关键词(cí)或者(zhě)一张(zhāng)照片,就能获得一幅AI创作的画作。

作画的(de)关键就是所输入的文本(běn)。同(tóng)一(yī)组关键词也(yě)可以创(chuàng)作出很(hěn)多(duō)张(zhāng)风格不一样的画作,这(zhè)让(ràng)创作的过(guò)程就像开(kāi)盲盒。

很多用户很喜欢这(zhè)种(zhǒng)不确定(dìng)的(de)惊喜(xǐ),他们会将(jiāng)生成的(de)美图当做头像。而另一部分喜欢翻看AI绘画的“翻车”作品。在(zài)社交媒体上(shàng),许多用户(hù)分享AI“翻车(chē)现(xiàn)场(chǎng)”,例如(rú),一(yī)位网(wǎng)友(yǒu)的小(xiǎo)狗照片被AI画成了“肌(jī)肉男”,还有网友的个人(rén)照片被AI识(shí)别成了建筑。

而(ér)如今随着ControlNet的出现(xiàn)与加(jiā)持,以(yǐ)往AI绘画的填写关键词游戏可能要被(bèi)颠覆了。

ChatGPT之(zhī)后又(yòu)一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

ControlNet是(shì)一(yī)位正(zhèng)在斯(sī)坦福读博的(de)中国人(rén)张吕敏创作(zuò)的一种(zhǒng)基于控制点的图(tú)像变形算法,主要用于数字图(tú)像处理(lǐ)、计算机视觉(jué)和(hé)计(jì)算机图形学(xué)等领(lǐng)域。

其SD插件一(yī)经发布,在短(duǎn)短的两天内便成为了AI绘画(huà)领(lǐng)域最新的热点。

在此之前,大家(jiā)用了很(hěn)多方法(fǎ)想让AI生成(chéng)的结果尽可能的符合要求,但(dàn)是都(dōu)不尽如人意,它的(de)出现代表着AI生成(chéng)开始进入真(zhēn)正的(de)可控时期。

因为ControlNet可以直(zhí)接(jiē)提(tí)取画面的(de)构图,人物的姿势和画面的深度信息等。有了它的帮助,就不用频繁(fán)的用(yòng)提示词来(lái)碰运气(qì),抽(chōu)盲盒式的创(chuàng)作(zuò)了(le)。

通(tōng)俗(sú)的说ControlNet相当(dāng)于给AI绘画(huà)加了“魔法”,不少博主的作品已经获得(dé)了大量(liàng)的浏览量,“viggo”就(jiù)是其中之一(yī),他(tā)用朋友的照片直(zhí)接带她(tā)们走进(jìn)动(dòng)漫(màn)世(shì)界。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控(kòng)期,将洗牌(pái)科(kē)技行业(yè)?_黑料正能量(liàng)

viggo先用(yòng)StableDiffusion图片转文字。

再(zài)用(yòng)Text2Prompt插(chā)件拓展找到对应的关键词;最(zuì)后用ControlNet插(chā)件绑(bǎng)定骨(gǔ)骼开始换关键词(cí)试效果。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗(xǐ)牌科技(jì)行业(yè)?_黑料正能量(liàng)

通过图片就(jiù)可以看(kàn)出来,效果十(shí)分惊艳。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可(kě)控期(qī),将洗牌科技行(xíng)业?_黑料正能(néng)量

更厉害的是,除了(le)真实(shí)的照(zhào)片,草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿(gǎo)转全(quán)彩图。大神(shén)张吕敏其本尊也亲自回应。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑(hēi)料正能(néng)量(liàng)

不得不说(shuō)当下AIGC已经变得越来越强大,甚至输出的作(zuò)品都(dōu)已经能以假乱真(zhēn)了。

02

难辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州金鸡湖有(yǒu)游艇party”的消息火遍(biàn)网络,而(ér)经过警(jǐng)方辟(pì)谣这所谓的“party”可能(néng)是全国第一起AI绘图诈(zhà)骗。

由于这个活动里面给出的美女照(中国为什么叫兔子国zhào)片都是AI制作的真(zhēn)人照片绘图,因为太逼真(zhēn),被大家当成真事传(chuán)播了

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能量

不(bù)过仔细观察可(kě)以发现,活动发(fā)起(qǐ)者提供的照片中(zhōng)有个很大的漏洞可以发现(xiàn)并(bìng)非(fēi)真人,而(ér)是(shì)AI绘图(tú),那便是图片中女性的手指部分(fēn)有的存(cún)在(zài)异常。

ChatGPT之(zhī)后(hòu)又一应(yīng)用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌(pái)科技行业?_黑料正能量

有行业人(rén)事表示:“现在因为手指部分的(de)绘画算法比较复杂,AI还不太会画人的手(shǒu),但(dàn)最新(xīn)看到(dào)的图片已(yǐ)经有越来越完美的AI模型(xíng)出现(xiàn),以后(hòu)可能(néng)就完全(quán)没有漏洞了。

类似的AI作图诈骗(piàn)在(zài)国(guó)外也(yě)已有发生。据英国广播(bō)公(gōng)司报道,土耳其地震期间,有Tiktok用户使用AI合成了儿童受(shòu)灾的假(jiǎ)照片(piàn)发(fā)布(bù)到网络,以此诱骗善良的人(rén)打赏“捐助”从而实施诈骗。

目前随(suí)着技术发展(zhǎn),AIGC已经能做出真人照(zhào)片(piàn)般的绘图效果,如果这样的图片被用(yòng)来诈骗(piàn),将非常可怕。

此(cǐ)外AIGC还引发了很多担(dān)忧,一方(fāng)面,批判者(zhě)认为AI在“学习”了大量前(qián)人的作品之后,其创(chuàng)作没有(yǒu)任何情绪和灵魂,难以和人类的艺术创作相提并论。

另一方(fāng)面,AIGC背后(hòu)的版权、目前(qián)都并没有得到有效的解决,还有AIGC会不会(huì)代替人类“至高无上”的创(chuàng)意(yì)。

马(mǎ)斯克(kè)也(yě)强调,人工智能的安全问题需(xū)要得到重视(shì),太(tài)晚(wǎn)就来不及(jí)了。

03

AIGC下(xià)一站除(chú)了视频,还有(yǒu)远方

技术(shù)都是有两面性的,潜在的危害并不能掩盖其光(guāng)辉的贡献。现在看来,人工智能技术将(jiāng)是第(dì)四次(cì)工业革命的核心驱动力(lì)量,将创造新的增(zēng)长奇迹。

过(guò)去一年,人工智能在技术和(hé)商业(yè)层(céng)面都有了巨大进展(zhǎn),AI绘画就是(shì)人工智能(néng)技(jì)术(shù)发生方向性改变的一个(gè)代表。其下一站或(huò)许就是(shì)视频。

此前,Meta和谷歌(gē)先后发(fā)布了几条引爆科(kē)技圈的短视频。这些视频(pín)引(yǐn)发关注并非内容做得多优秀,反而都非常简单(dān),比如一匹正在(zài)喝水的马(mǎ),一只画画的玩具熊,或(huò)者(zhě)一段骑摩托车的(de)第一视角录像,随便一(yī)个有手机的人都可以随手录下一(yī)段。

ChatGPT之后又(yòu)一应用(yòng)杀疯了(le),AIGC或进入(rù)可控期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑料正能(néng)量

但这些短视频的创作方式(shì)非常简单,创作者(zhě)仅仅需(xū)要向AI输(shū)入一段话,甚至只(zhǐ)是(shì)说一下(xià)要(yào)求,AI就可以根据需要生(shēng)成一段(duàn)视频。

谷歌发布的两个(gè)AI生成视(shì)频分别(bié)来(lái)自于Imagen Video和(hé)Phenaki,前者主要突出(chū)的是高清,与Meta的Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布(bù)了AI生成的视频后(hòu),AI圈(quān)就已经玩了一波梗,一个能够做出更高清视频的(de)AI还不足以在短时间内戳中(zhōng)兴奋点。

Phenaki更(gèng)加令人(rén)震惊的地方在于(yú),它可(kě)以制(zhì)作出(chū)超过2分钟(zhōng)的(de)连贯(guàn)的也有确切内容的视(shì)频(pín),这才是真(zhēn)正让人们感到惊喜(xǐ)的地(dì)方。因为无论AI生成(chéng)的(de)视(shì)频多么高清,也只能是(shì)为内(nèi)容生(shēng)产者提(tí)供一(yī)个灵感,一个(gè)素材,一个过场动(dòng)画。

不过(guò)能够制作出有具(jù)体剧情(qíng)内容的(de)视(shì)频就意味着,一些视(shì)频创(chuàng)作由AI代替人工完成已经初步有了可能(néng)。

当下AI的发展速度(dù)已经超过(guò)大部分人的(de)想象。内容产业的本质(zhì)是供给(gěi)创造需求,AIGC作为全新的内容生产方式,可以(yǐ)为内容产业带来更(gèng)新(xīn)的(de)内容风格、更快的生(shēng)产(chǎn)速(sù)度,更低的生产成本(běn),这无(wú)疑(yí)会驱动内容产(chǎn)业的大爆发(fā)。

除了AI绘图(tú)、视频(pín),AIGC技术还能应用于音乐(lè)、代码(mǎ)、机器(qì)人(rén)动(dòn中国为什么叫兔子国g)作(zuò)等多种内(nèi)容形式的生成。不难发现(xiàn)该项技术不(bù)仅(jǐn)在游戏(xì)等行业(yè)能得到有(yǒu)效应用,对于(yú)下一(yī)代互联(lián)网各种元素(sù)的构建亦有关(guān)键(jiàn)意义。

从商业化的(de)角度来(lái)看,文化(huà)娱(yú)乐、教(jiào)育、传媒等诸多领域,本(běn)身就对基于AI的可视化内(nèi)容(róng)有强烈需求。

因此,AI绘画及视频或不是(shì)结果(guǒ),而只是AI进程中的一块重要(yào)拼(pīn)图,有望在(zài)技(jì)术更新(xīn)的(de)加持下实现更大(dà)的应(yīng)用(yòng)价值。

AI从理解内容,走向(xiàng)了可以(yǐ)生成(chéng)内容,甚至能够(gòu)创造(zào)出独立(lì)价值和独立视(shì)角的内容(róng)。AIGC的再次(cì)出圈,更(gèng)代表着未(wèi)来的先(xiān)进生产(chǎn)力即将(jiāng)到(dào)来。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量(liàng)

04

紧抓大模(mó)型与(yǔ)算力,牢固(gù)AIGC底(dǐ)座

从技术(shù)的发(fā)展也可以看(kàn)出,在语言大模型、图像(xiàng)大模(mó)型之后,多模态大模型已经成为了新(xīn)的趋势。

大模型被誉为当前(qián)人工(gōng)智能发展的智(zhì)能底座,是全球竞争(zhēng)最(zuì)激(jī)烈的研究(jiū)方向之一,包括谷歌、亚马逊(xùn)、百度、阿(ā)里、腾讯(xùn)等众多(duō)头部企(qǐ)业都(dōu)在竞相发力。

不(bù)过训(xùn)练大(dà)模型(xíng)的确价格不菲,以国盛证券发布的(de)《ChatGPT需要多少算力》报告估算,GPT-3训(xùn)练一次的成本约为(wèi)140万美(měi)元。而对于(yú)一(yī)些更大的LLM(大(dà)型语言(yán)模(mó)型),训(xùn)练成(chéng)本则介于200万美元(yuán)至1200万美元高价之(zhī)间。

以ChatGPT在2023年1月(yuè)的独立访客平均数(shù)1300万计算,其对应芯(xīn)片需求为(wèi)3万多片英伟达(dá)A100 GPU,初始(shǐ)投入成本约为8亿美元,每(měi)日仅电费(fèi)就在5万(wàn)美元(yuán)左右。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业(yè)?_黑料正能量(liàng)

此(cǐ)外不论(lùn)是(shì)ChatGPT还是AIGC,都离不开庞大(dà)算力(lì)支持。在关注各类大模型的发(fā)展同时,更应该关注算力网络的建设。

算力网络正(zhèng)驱(qū)动AI产业发展进(jìn)入史诗级加速进程,让AIGC及(jí)通(tōng)用AI这一人工智能发展的终极目标离得更近。

因为算力可以对(duì)突(tū)破性技术创(chuàng)新提供大力的支持(chí)。这方面,多模态大(dà)模型(xíng)是(shì)典型。作为(wèi)面(miàn)向未来(lái)强人工智能、通用(yòng)人工智(zhì)能的(de)重要技术创新,多(duō)模态大模型(xíng)已经(jīng)在人工智能领(lǐng)域(yù)提出了很多年,业界也有不少技(jì)术突破,但是,多模(mó)态(tài)大模型进一步往下走,算力需求呈几何式上升,一般(bān)的算力基础(chǔ)设施很快将难(nán)以胜任。

从图像(xiàng)、文字、语音单独一(yī)项的训练,到双模态、三模态的跃迁,让人(rén)工智能可以灵活(huó)应(yīng)对不(bù)同(tóng)模(mó)态的转化、像人与(yǔ)世界交互一(yī)样自(zì)然,这方(fāng)面,由算力网络来驱动将(jiāng)有明(míng)显(xiǎn)优势。

ChatGPT之后(hòu)又(yòu)一(yī)应(yīng)用杀疯了(le),AIGC或进入(rù)可控期(qī),将洗(xǐ)牌科(kē)技行业?_黑料正(zhèng)能量

此外,还有很(hěn)多需要爆发式增长的算力来支撑的(de)技术(shù)创新,将在人工智能算力网络支撑下(xià)快速推进(jìn)。

AIGC已经露出曙光,期待在大模型和大(dà)算力的(de)支(zhī)持(chí)下AIGC能持续颠覆内容(róng)生产的(de)方(fāng)式,将创(chuàng)造(zào)的边际(jì)成(chéng)本降低(dī),让万(wàn)众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 中国为什么叫兔子国

评论

5+2=