谷歌发布基础世界模型Genie，能一图创建互动的虚拟环境

广告服务

党报头条官网>>财经科创

谷歌发布基础世界模型Genie，能一图创建互动的虚拟环境

来源：科技日报

发布时间：2024-02-29 16:10

生成海报

党报头条是中国报业传媒矩阵平台

　　据谷歌公司官网26日报道，谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie（精灵）。其可从合成图像、照片、草图生成多种动作可控的环境。

Genie效果的动图截图演示。图片来源：谷歌官网

　　过去几年，生成式人工智能（AI）模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式，即生成式交互式环境，通过单个图像提示即可生成交互式、动作可控的环境。

　　Genie是一个110亿参数的基础世界模型，在超过20万小时的二维（2D）游戏视频上进行训练，无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。

　　Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的，而且能根据生成的环境来推测出多种潜在的动作。

　　该模型接受单个图像（无论是AI合成图像、照片还是草图），并将其转换为可玩的游戏，响应用户控件。从图像到基本的交互环境一步到位。

　　用户只需提供一张纸上的草图、一幅完美的数字艺术作品，甚至是AI生成对2D世界的描述，Genie就会完成剩下的工作，帮用户生成2D游戏。

　　谷歌官网称，Genie专注2D平台游戏和机器人技术的视频，但方法通用，应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境，这为生成和进入虚拟世界的各种新路径开启了大门。（记者张梦然）

责任编辑：陈钇彤审核：金春妮

相关新闻

微信

扫描关注微信公众号

返回顶部

谷歌发布基础世界模型Genie，能一图创建互动的虚拟环境

来源：科技日报 2024-02-29 16:10:35

据谷歌公司官网26日报道，谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie（精灵）。其可从合成图像、照片、草图生成多种动作可控的环境。Genie效果的动图截图演示。图片来源：谷歌官网过去几年，生成式人工智能（AI）模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式，即生成式交互式环境，通过单个图像提示即可生成交互式、动作可控的环境。Genie是一个110亿参数的基础世界模型，在超过20万小时的二维（2D）游戏视频上进行训练，无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的，而且能根据生成的环境来推测出多种潜在的动作。该模型接受单个图像（无论是AI合成图像、照片还是草图），并将其转换为可玩的游戏，响应用户控件。从图像到基本的交互环境一步到位。用户只需提供一张纸上的草图、一幅完美的数字艺术作品，甚至是AI生成对2D世界的描述，Genie就会完成剩下的工作，帮用户生成2D游戏。谷歌官网称，Genie专注2D平台游戏和机器人技术的视频，但方法通用，应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境，这为生成和进入虚拟世界的各种新路径开启了大门。（记者张梦然）

关于我们|中国报业杂志|手机党报头条网|党报头条客户端下载

新闻热线：010-65363038投稿邮箱：zgbymedia@163.com咨询热线：010-65363038 合作热线：010-65363236

违法和不良信息举报电话:010-65363038 举报邮箱:zgbygg@126.com 《中国报业》杂志社有限责任公司

Copyright © 2017-2021 党报头条版权所有建议使用1024*768以上分辨率浏览

互联网新闻信息服务许可证10120220004 增值电信业务经营许可证京B-20192706 网络出版服务许可证 (署)网出证(京)字第327号

京ICP备14028561号京公网安备 11010502035902号