很久以来,AI这个词不再那么令人兴奋了。
但是,在这个全人类都在忙于卷土重来的2022年,AI取得了近年来最大的进化。
AI突然红了
这种疾风骤雨的飞跃是一场真正的革命,特别是在世界经济预期减弱的大背景下。
和所有革命一样,这场AI革命也不是一夜之间完成的。
并且,基于AIGC,即AI能力的内容制作也是重要的类别之一。 在2022年之前,囿于核心技术的极限,这个领域一直不温不火。 因为AI没有石成金之术,人类没有凭空创造的能力。 AI的“深度学习”训练不是自我意识的自主学习,而是通过收集大量样本让AI从海量数据中总结规律,基于人的指令,基于规律进行内容再生产的过程,核心算法硬件的门槛
AIGC沉寂了很久的革命火种,瞬间燎原。
绚烂的蓝海
想象一下,在未来的VR/AR虚拟世界中,你脑海中所想的视频会通过ai生成技术实时渲染。 这会给人们的娱乐和获取信息的方式带来什么样的颠覆?
但这并不是在当今经济大环境极其低迷的情况下,市场对AI投赞成票的全部原因,虽然广泛的商业潜力具有吸引力,但更应该投入的是AI技术本身。 这场革命还没有结束,下一章已经向人们走来。
那就是生成视频。
视频本质上是连续的静止图像,随着ai图像生成技术的成熟,很多人都将目光投向了视频生成领域,9月以来,元和谷歌发表了这一AIGC前沿领域的最新成果。
Meta的模型名为Make-A-Video,通过学习大量的文本-图像组合样本数据和无文本标记的视频,了解现实世界物体的运动逻辑,Make-A-Video可以在构建图像的基础上移动图像,同时
名为imagen video的模型使用一种称为级联扩散系列模型的方法生成视频。 也就是说,先用基础扩散模型生成分辨率小的视频,再用空间超分辨率模型提高视频的分辨率和帧数。
视频生成模型还处于起步阶段,在具体动作细节画面清晰度不同物体与人的交互等方面还很稚嫩,从分辨率到画质都有很深的“人工智能”痕迹。 但是,回想一下AI图像生成模式也同样经历了从全网群到逆袭的过程,之后的视点现在也没有改变,这不就是AIGC革命下一次高潮即将到来的预言吗?
戏剧性的变化引起的争论
AI生成内容的版权问题该如何定义?
有趣的是,很多AI生成技术深度学习训练中使用的数据库可能包括侵权内容,但是由于该原因,用户产生内容的可能性非常低。 由于生成内容本身非常随机且不确定性高,因此即使陷入著作权争论,举证过程也极其困难。
AI生成内容有艺术性吗? 如果有,该如何评价和定义?
AI生成内容的艺术性在半年前还是个无聊的问题,《歌剧院空间》作品获奖后,人们越来越多地谈论它。
一般来说,AI生成的内容不是自己制作的,而是受自己的模型算法和数据库示例的容量影响。 这是很多人主张AI生成内容“没有灵魂”的原因。
但是,只把AI生成技术看作纯粹的工具也是不公平的。 它不仅可以模仿,还因为算法和样本共同提供了现有人类无法完全提供的创作视角。
现有的AI图像生成技术极大地降低了人们参与图像创作的门槛,因此对生成作品的艺术鉴赏或许应该从更细分的角度入手。 NFT与传统艺术品一样,其价值有待市场验证,但艺术品市场处于了解和接受它的初期阶段。
随着AI生成图像的内容越来越丰富和真实,他们从根本上阐明了商业画廊赖以生存的运营模式——。 如果图片可以自己生成,谁来花钱买图呢?
AI生成内容应该如何监管,如何防止虚假信息和不恰当信息的发布?
同时,尽管深度学习使用的数据库经过严格筛选,屏蔽了色情暴力恐怖等内容,但社会刻板偏见种族歧视等内容在技术上并未完全消除,更重要的是,任何所谓的偏见因此,谷歌决定在排除相关风险之前推迟发布imagen视频模型。 许多公开的模型为了避免潜在的争论,决定在其生成作品上打上不可去除的水印。
AIGC革命正在蓬勃进行,那不是将来的时候,而是正在进行中。 我们已经在其中了。
现在就是未来。
发表评论